{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 69,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import os\n",
    "os.chdir('G:\\\\项目\\\\网易云音乐评论')  # 打印当前工作目录"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 51,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "                                                       context\n",
      "328901978                                              都是有故事的人\n",
      "1724358802                                        每天都要听至爱Danny\n",
      "451250610                                   对呀，你就从来没喜欢过我。一点都煤油\n",
      "554348857                                              沁入心脾的温柔\n",
      "1296389446                                            最近好喜欢这首歌\n",
      "303721726                                               今日点歌③.\n",
      "1654009353                                           偏偏对你没有抵抗力\n",
      "1654009353   那一次我们擦肩而过，我害怕我们会像电影里的情景一样错过，所以我没有走，我一直看着你走，可是你...\n",
      "357343565                                  “我喜欢你”珍贵，奈何听的人不珍惜……\n",
      "293896875                                           偏偏喜欢你  王雷雷\n",
      "1510414811                                          对啊，这是为什么呢。\n",
      "1574359988                                               对，好浪漫\n",
      "1333924430                             小时候有个小的收音机，好开心，睡觉都舍不得放下\n",
      "64188725                                                    好听\n",
      "482121141                                       这些歌曲都是经典作品[亲亲]\n",
      "427963594                                        偏偏喜欢你，我的翩翩夫人。\n",
      "1382017788                           以爱情  以时光\\r\\r\\n\\r\\r\\n纪贯新~?\n",
      "46656982     我和他来一家店吃饭，店里在放这首歌，他问我，你知道这首歌是什么吗？我听了一下说不知道，他说：...\n",
      "425557078                                               幸福到疼……\n",
      "有一个人曾让我知道                                                  NaN\n",
      "寄生于世原来是那么的好                                                NaN\n",
      "568096298                               超级喜欢的一首歌，偏偏喜欢你【大赞】[爱心]\n",
      "412381224                                           他可能会单手开法拉利\n",
      "301593622                              [多多大笑][多多大笑][多多大笑]笑着活下去\n",
      "1455906926                                              再见吧大渣男\n",
      "1670031755                                        [憨笑]我比你还俗 更穷\n",
      "301593622                                   现在一心只想搞钱，我比较俗，太穷了！\n",
      "1730181168                                          哈哈哈哈这个年代感哦\n",
      "279684331                                          偏偏喜欢的就是得不到！\n",
      "621542625                                                 阿Lan\n",
      "...                                                        ...\n",
      "62338668                                                  nice\n",
      "62338668     愛上你永遠沒有結果 很好 我現在要放棄了 努力忘記你 不想讓自己為了一個沒結果的人那麼難受 ...\n",
      "68320201     忽然想起和一个朋友的对话，她因为家庭原因极度缺乏安全感。\\r\\r\\n我怕…\\r\\r\\n你怕什...\n",
      "246752393                                                  張國榮\n",
      "134205876          还记得那时地方电视台点播的一些曲子吗？重点中间无广告，那才是乐趣。某某点歌给谁谁谁……\n",
      "122104993    班固?《西都赋》“愿宾摅怀旧之蓄念，发思古之幽情。” 元稹?《赠吴渠州从姨兄士则》诗“泪因生...\n",
      "100442347                  中午广播无意听到这首歌，然后特意关注了聊大广播台微博找到歌单！[大哭]\n",
      "118207115                                                 别咒王杰\n",
      "116595775                        我爸只会唱一首歌，就这首歌把我妈娶到手了。[憨笑][憨笑]\n",
      "60109810                                       2000年生却偏偏喜欢80年代\n",
      "63357164                                       情爱 是什么 只有呵呵[大哭]\n",
      "62338668                                                  [可爱]\n",
      "95087236                                            对啊，为何偏偏喜欢你\n",
      "68320201                                                  [大笑]\n",
      "79282042                                          [皱眉][皱眉][皱眉]\n",
      "83512955                                听过这首歌的人都是有故事的男人和女人[跳舞]\n",
      "67061365       上班特别累的时候听到香港的经典感觉整个世界都属于我，要是来一杯纯正的香港奶茶就更好了。[大笑]\n",
      "71401843                                        当年的录像厅前面就放的这首歌\n",
      "103882075                                             他还没死[大哭]\n",
      "62338668                                                  我01的\n",
      "62338668                                                  nice\n",
      "62338668     愛上你永遠沒有結果 很好 我現在要放棄了 努力忘記你 不想讓自己為了一個沒結果的人那麼難受 ...\n",
      "68320201     忽然想起和一个朋友的对话，她因为家庭原因极度缺乏安全感。\\r\\r\\n我怕…\\r\\r\\n你怕什...\n",
      "246752393                                                  張國榮\n",
      "134205876          还记得那时地方电视台点播的一些曲子吗？重点中间无广告，那才是乐趣。某某点歌给谁谁谁……\n",
      "122104993    班固?《西都赋》“愿宾摅怀旧之蓄念，发思古之幽情。” 元稹?《赠吴渠州从姨兄士则》诗“泪因生...\n",
      "100442347                  中午广播无意听到这首歌，然后特意关注了聊大广播台微博找到歌单！[大哭]\n",
      "118207115                                                 别咒王杰\n",
      "116595775                        我爸只会唱一首歌，就这首歌把我妈娶到手了。[憨笑][憨笑]\n",
      "60109810                                       2000年生却偏偏喜欢80年代\n",
      "\n",
      "[20523 rows x 1 columns]\n"
     ]
    }
   ],
   "source": [
    "import pandas as pd\n",
    "data = pd.read_csv(r\"DealtedData.csv\",encoding='gbk', sep=',',index_col=0,header=0)\n",
    "print(data)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 53,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "documents=list(data['context'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 54,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['都是有故事的人',\n",
       " '每天都要听至爱Danny',\n",
       " '对呀，你就从来没喜欢过我。一点都煤油',\n",
       " '沁入心脾的温柔',\n",
       " '最近好喜欢这首歌',\n",
       " '今日点歌③.',\n",
       " '偏偏对你没有抵抗力',\n",
       " '那一次我们擦肩而过，我害怕我们会像电影里的情景一样错过，所以我没有走，我一直看着你走，可是你连回头看我一眼都没有  ，真好！',\n",
       " '“我喜欢你”珍贵，奈何听的人不珍惜……',\n",
       " '偏偏喜欢你  王雷雷',\n",
       " '对啊，这是为什么呢。',\n",
       " '对，好浪漫',\n",
       " '小时候有个小的收音机，好开心，睡觉都舍不得放下',\n",
       " '好听',\n",
       " '这些歌曲都是经典作品[亲亲]',\n",
       " '偏偏喜欢你，我的翩翩夫人。',\n",
       " '以爱情  以时光\\r\\r\\n\\r\\r\\n纪贯新~?',\n",
       " '我和他来一家店吃饭，店里在放这首歌，他问我，你知道这首歌是什么吗？我听了一下说不知道，他说：偏偏喜欢你。[爱心]',\n",
       " '幸福到疼……',\n",
       " nan,\n",
       " nan,\n",
       " '超级喜欢的一首歌，偏偏喜欢你【大赞】[爱心]',\n",
       " '他可能会单手开法拉利',\n",
       " '[多多大笑][多多大笑][多多大笑]笑着活下去',\n",
       " '再见吧大渣男',\n",
       " '[憨笑]我比你还俗 更穷',\n",
       " '现在一心只想搞钱，我比较俗，太穷了！',\n",
       " '哈哈哈哈这个年代感哦',\n",
       " '偏偏喜欢的就是得不到！',\n",
       " '阿Lan',\n",
       " '曾经他为我唱过的歌，到如今听到都心里隐隐作痛',\n",
       " '爱，直至成伤；之后，就是永远',\n",
       " '打卡',\n",
       " '男神音！',\n",
       " '没人能比Danny唱得更好',\n",
       " '最喜欢的一首粤语歌[可爱]',\n",
       " '以前的歌太好听了 温柔细腻听着很舒服',\n",
       " '那你那儿冷吗',\n",
       " '我不是长安的呢。[呆]',\n",
       " '那一年我以为你喜欢我，那一年我偏偏就喜欢你，白驹过隙一晃快十年，想来原来是如此简单',\n",
       " '男女共用厕所中，我放着这首歌，后面一小姐姐唱得比原唱还好听',\n",
       " '当时目的就不纯',\n",
       " '这首歌是真的好听',\n",
       " '谈恋爱也跟考大学一样啊，得努力才行',\n",
       " '天妒英才',\n",
       " '就一直等\"心底如今满苦泪\"，\"爱已是负累\"。觉得这两句好听',\n",
       " '也不能这么偏激啊，现在也有不错的歌，只是风格不一样',\n",
       " '德华呢？',\n",
       " '00后，签到',\n",
       " '我爸唱了20年，百听不厌',\n",
       " '我爸爸最喜欢的歌',\n",
       " '以后不会再为你失眠了',\n",
       " '我00年的男孩，一直爱着这首歌',\n",
       " '主要是有这几个影响力辈分大吗',\n",
       " '经典1983',\n",
       " '哦[蛋糕]',\n",
       " '面对社会我也是这样，有时候也很迷茫',\n",
       " '作为一个91年的女孩子，没有爱情，还没踏出校园，把学业当成事业来努力经营，努力做到最好，很辛苦，做个试验戴个口罩，摘下来发现皮肤都会有痕迹了，有时候也会很焦虑，焦虑自己的未来在哪里，不想随便找个人嫁了，没有感情的结合是没有意义的，但是现在除了每天让自己忙到忘记也不知道自己拥有什么',\n",
       " '此刻，正在赶2019年年度工作计划，作为一个90年女孩子，没有爱情，工作当成事业努力经营，在进入现在这个行业快4年的时间，做到小中层的位置也有一年了，很辛苦，脸也以肉眼可见的速度垮着，有时候很丧有时候很焦虑，焦虑自己的年纪焦虑自己的感情，但是除了努力多赚钱又不知道自己能拥有什么。',\n",
       " '现在大约只有小学生才敢说 爱 吧',\n",
       " '现在2019了，喜欢也变得也朗朗上口了。',\n",
       " '听一首老歌，来怀念过去—只是一个零零后',\n",
       " '不论真假陌生人，加油加油加油2019',\n",
       " '？还是同城？',\n",
       " '你给我听了这首歌，请相信我我从未想要让你难过受伤。\\r\\r\\n再过两周，我会告诉你:           。',\n",
       " '你是媒婆啊',\n",
       " '哈哈哈 有意思',\n",
       " '这个的原评论在泰坦尼克号的主题曲下面，不要再发了好嘛？',\n",
       " '在网易云陈百强哥哥的详情背景很多[爱心]',\n",
       " '还有罗文',\n",
       " '我中意你啊',\n",
       " '偏偏喜欢你[爱心]经典',\n",
       " '我就是听了几天偏偏喜欢你，然后日推给我上海滩?',\n",
       " '看了热评 发现都是才子佳人 我很惭愧?',\n",
       " '死的早啦',\n",
       " '曾经在感情最低谷最痛苦的时候，我把自己蒙在被子里，单曲循环这首歌，像疯子一样歇斯底里痛哭流涕。如今，又陷入了另一个漩涡，进退维谷，又翻出这首久违的歌，静静的听着，哪怕落泪也只是静悄悄，没有声音，而心里多了一份坚定。这么多年过去，我已经决定不再做一个情圣，从此，为自己而活',\n",
       " '偏偏喜欢你呐?',\n",
       " '最近很开心的 心动的感觉',\n",
       " '好听到心碎啊 哭了哭了',\n",
       " '谢过兄弟',\n",
       " '谢了老弟',\n",
       " '兄弟愿你过得好 让她安心。加油',\n",
       " '我一想到他张国荣还有一个人的遭遇我就头皮发麻',\n",
       " '优秀',\n",
       " '他说他朋友讲他长得像易建联，哈哈，虽然我们没见过，但是想象中应该是个很高大很正气的男孩子',\n",
       " '好听入心到哭啊',\n",
       " '很多年后，我已能流利地说粤语，在朋友的车上，从电台听到这似曾相识的旋律，才知道是陈百强的偏偏喜欢你。那一瞬，低头静听中，漫漫时光被浓缩成了一首歌的距离，可蓦然抬头时，只见维多利亚港湾的迷离灯火。原来已隔世。只有，偏偏喜欢你的歌声一如当年。',\n",
       " '年少不要遇到太惊艳的人，误终生',\n",
       " '刚刚考完试的喔[多多大笑]',\n",
       " '还在图书馆背书的我[流泪]',\n",
       " '爱而不得',\n",
       " '昨日，他对我说，我对你，都是真的。',\n",
       " '上了岸就别再想海里的事 ???',\n",
       " '本来我每个月要花钱开通爱奇艺、优酷、腾讯会员，自从在百度看到【徐纯聊电影】这篇文章之后，看爱奇艺、优酷、腾讯会员视频再也不用花钱了',\n",
       " '[狗][色]原来我每个月要花钱开通爱奇艺、优酷、腾讯会员视频，自从在摆渡看到【徐纯聊电影】这篇文章之后，看爱奇艺、优酷、腾讯会员视频再也不用花一分钱了[狗][色]',\n",
       " '喜欢而不得，心底里满是苦泪',\n",
       " '下乡六年，机关又拼了五年，而今却站在事业单位改革的瓶颈口看不到了希望，政策大于天没有了辛勤拼来的水到渠成，是偏偏的旋律老陈的嗓音在帮我渡关，单曲重听间让我知道一味痛楚不如改变自己，不争馒头也不争口气，选择幸福的活着。要去香港看望下老陈，你的歌你的音容真的能救赎人，让人继续喜欢生活',\n",
       " '一样失眠了',\n",
       " '2019.1.11 早7点  不眠的日子 我来过   ',\n",
       " nan,\n",
       " '年年岁岁花相似，\\r\\r\\n岁岁年年人不同。',\n",
       " '第一次听他在快手唱“愁绪挥不去苦闷散不去……情义已失去，恩爱都失去，我却为何偏偏喜欢你”差点哭出来，我知道我最想要的是他好好地啊，他大概不会知道那个唯二的粉丝是我吧，可我还是要等着他',\n",
       " '世上再无此人',\n",
       " '从细听到大嘅经典',\n",
       " '偏偏喜欢你',\n",
       " '兄弟，我不知道该说啥。愿您……牛逼，幸福。',\n",
       " '人生如戏啊[哀伤]',\n",
       " '以前这才是我们想要的音乐啊[流泪]',\n",
       " '卡带时代',\n",
       " '我妈妈喜欢这首歌，我爸爸是音痴，但是我某天听见我爸深情款款的把这首歌唱出来了 。',\n",
       " '照片里一共四人，分别是陈百强，王杰，张国荣，梅艳芳，当年的三王一后',\n",
       " '最喜欢的粤语歌之一[多多比耶]',\n",
       " '经典老歌，好听！',\n",
       " '滚滚红尘中，偏偏喜欢你一人，虽不得，但与你相遇已是此生最大的幸运，愿你安好',\n",
       " '有台山人嘛？[大笑]',\n",
       " '挺美好嘛[憨笑]',\n",
       " '哎',\n",
       " '偏偏喜欢你的歌词就是这样 很美好 美好的不真实 对啊 我却为何偏偏喜欢你？总在骗自己不稀罕流水的感情 可你是不是也认为我就是这种人啊 当所有的期待都成了理所当然 不回消息也成了理所当然 真的 习惯了',\n",
       " '2019/1/10成功表白JW，两年前错过了一次感觉失去了很多，两年后的今天，我不会让错误在犯第二次  I LOVE YOU[亲]',\n",
       " '李振云 他同样是喜欢你的 偏偏喜欢你 你真的 真的不是一厢情愿 可不可以下辈子 都把爱说出来',\n",
       " '眼',\n",
       " '分手一年了，当时因为孩子有了啦她不愿意要才分手的，现在怨恨也淡了，还是很想她',\n",
       " '“我又为何偏偏喜欢你”这个调调喜欢',\n",
       " '张国荣 陈百强 谭咏麟也有',\n",
       " '我性取向，正常，谢谢[汗][汗][汗]',\n",
       " '你可能是个意外[大哭][大哭]',\n",
       " '嘿，这么老的歌你应该不会听吧！世界这么大，我怎么偏偏喜欢你。小学我不知道那是不是喜欢，但到了初中，到现在的高中，我觉得应该是了。我看你交了两个男朋友，看你们牵手，拥抱，我真的很难过，可是我没办法，因为我谁也不是啊。现在我真的很想找你聊聊天，可你为什么总是把天聊死啊！限制了，我爱你',\n",
       " '世间女子千千万，我却偏偏喜欢你',\n",
       " '甘兆妃，偏偏我就喜欢你',\n",
       " '现在不还是随便说说',\n",
       " '耐听的永远是这些老歌，感觉就像是它的情感在随着我的心情变化。听不腻！',\n",
       " '应该马上快要5年之前14岁的我和一个10岁女孩玩，现在我大一了，她应该初中或者快要高中吧，她笑得很开心，我们都在厦门，很想跟她见面，她是2004出生的女孩，祝我们再见面吧，我有她照片，她和我玩平板游戏很开心地笑着，照片也是很开心的！',\n",
       " '就你皮',\n",
       " '14.w',\n",
       " '你如何读出来的？',\n",
       " '哈哈 你是小三啊？',\n",
       " '你只有真的唱起这首歌的时候，你才能领略Danny的才情一二。',\n",
       " '谢谢你凯文。你也是',\n",
       " '当琦琦再回到那条河边的时候……',\n",
       " '加油，要好好生活！陌生人',\n",
       " '因为太优秀了，上天要把他带走',\n",
       " '謝謝侬。',\n",
       " '仿佛穿越到那个让人迷醉的年代。',\n",
       " '期待这首歌10w+的那天！丹尼的音乐和他本身都是宝藏，时光流逝也无法磨灭其光芒！希望有越来越多的人认识到、欣赏到~',\n",
       " '耐听',\n",
       " '是的是的',\n",
       " '直觉准到可怕，世界上是真实存在心灵感应这回事儿的。',\n",
       " '想到了张骏和琦琦',\n",
       " '华仔呀',\n",
       " '加油吧，陌生人们',\n",
       " '加油，陌生人',\n",
       " '明白到爱失去一切都不对',\n",
       " '人生建议 永远不到等一个男孩长大',\n",
       " '一样一样！帅哥在电台给美女点的歌，然后有了我',\n",
       " '97年我很喜欢83年的偏偏喜欢你?????????',\n",
       " '那张照片还有一个王杰，可惜了，现在就剩下王杰了，他也早退了，被人下毒伤了喉咙',\n",
       " '一个人听，居然也会有感触',\n",
       " '加油 努力 做自己 不将就 你比我强 我比你大 现在一无所有?',\n",
       " '加油 你比我强 做自己活在当下就好',\n",
       " '偏偏',\n",
       " '看完《金鸡》，突然就想起这首歌了',\n",
       " '我爸喜欢听 从小听到大 到现在还是喜欢听这首嘻嘻',\n",
       " '真是太他吗的好听了',\n",
       " '期待这首歌10w+的那天！丹尼的音乐和他本身都是宝藏，时光流逝也无法磨灭其光芒！希望有越来越多的人认识到、欣赏到~',\n",
       " '耐听',\n",
       " '是的是的',\n",
       " '直觉准到可怕，世界上是真实存在心灵感应这回事儿的。',\n",
       " '想到了张骏和琦琦',\n",
       " '华仔呀',\n",
       " '加油吧，陌生人们',\n",
       " '加油，陌生人',\n",
       " '明白到爱失去一切都不对',\n",
       " '人生建议 永远不到等一个男孩长大',\n",
       " '一样一样！帅哥在电台给美女点的歌，然后有了我',\n",
       " '97年我很喜欢83年的偏偏喜欢你?????????',\n",
       " '那张照片还有一个王杰，可惜了，现在就剩下王杰了，他也早退了，被人下毒伤了喉咙',\n",
       " '一个人听，居然也会有感触',\n",
       " '加油 努力 做自己 不将就 你比我强 我比你大 现在一无所有?',\n",
       " '加油 你比我强 做自己活在当下就好',\n",
       " '偏偏',\n",
       " '看完《金鸡》，突然就想起这首歌了',\n",
       " '我爸喜欢听 从小听到大 到现在还是喜欢听这首嘻嘻',\n",
       " '真是太他吗的好听了',\n",
       " '十几岁的年纪，偏偏喜欢听老歌[狗]',\n",
       " '陈百强的歌里，偏偏喜欢你和下一首的一生何求特别适合撩人',\n",
       " '之前每次在我家人车上听到这首歌却不知道叫啥名 今天推荐给了我。很不错',\n",
       " '为何我 ',\n",
       " '在一部小说中知道这首歌，从此就爱上了。好多人都说那不是小说，而是一个真实的故事。其中一个男主叫 李振云。“情不知所起，一往而深”。也是从这里记住的。',\n",
       " '这才是经典',\n",
       " '带上耳机就听到了这首歌，很自然的想起他，很自然的笑了。希望他也有一个偏偏喜欢的人吧，我有我自己就够了',\n",
       " '偏偏懂爱的年纪遇见你刚好毕业却离开你，走过回头看你却还是小鹿乱撞的心情，还是满怀的期待，可我却找不到勇气再去伤害身边关心我的人',\n",
       " '我还以为陈百祥??',\n",
       " '差不多一个小时就见面咯，小艺娃，芜湖近日的蒙蒙细雨，在你来的这天都如此可爱(?? . ??)等会悄悄溜下班，回去带你吃好吃滴去[这边][这边]',\n",
       " '真实',\n",
       " '好听呀',\n",
       " '[18][18][18]',\n",
       " '你是不是每首歌下面都刷',\n",
       " '分开三个月，为何我偏偏喜欢你。想鼓起勇气找你一次，却又胆怯。',\n",
       " '@信仰啊iiii',\n",
       " '我不知道你们是否也这样  你喜欢的人总会问你一句你为什么喜欢我  喜欢我哪？',\n",
       " '太好听了吧',\n",
       " '经历相同诶。这位帅哥当着全校的面弹着吉他唱着这首歌给这位美女听。这位帅哥当时19岁，而这位美女才16。然后两人吵吵闹闹十一年就有了我(?>?<?）',\n",
       " '。。。缺父爱啊，或者生活在不完整家庭啊',\n",
       " '好听',\n",
       " '陈百强的歌曲总是那么忧郁',\n",
       " '大概没有人知道，第一次听到这首歌是在2001年天津开往北京的火车上，在某人的mp3里。当时感觉心被一下子戳动了，不知道因为歌，还是因为人。',\n",
       " '人这辈子虽然不在了，但流传着自己唱过的歌别人在听，是多么一种享受',\n",
       " '明明听不懂歌词，眼泪却已湿润的眼眶',\n",
       " '可你都40岁了。',\n",
       " '曾经有一个未曾谋面的朋友，游戏里面认识的，他特别喜欢唱歌，我很乐意做他的听众，最喜欢他唱这首偏偏喜欢你，非常好听，我们以前能聊很多东西，无所顾忌的，自从我有了生命中最重要的人之后，他向我表达过遗憾，后来他也有了重要的人。后来再也没有听过他唱歌。他是一个非常上进的男孩，我很荣幸。',\n",
       " '我已经对我的大哥哥说过我喜欢你这句话了，可他认为这不是男女之情吧！',\n",
       " '你们知道李振云嘛 ',\n",
       " '每次听这首歌 都会想起张国荣的感觉',\n",
       " '好听好听',\n",
       " '好听到哭',\n",
       " '怀旧的歌一般都是爱回忆的人听，因为走不出去，也放不下那个人。所以喜欢的人也是每晚习惯去想，去念的',\n",
       " '一样',\n",
       " '你的网名变成了几多年，我便改成了多年以后，这一等，便是四年。',\n",
       " '你身上发着光的，只是以后我都不敢再多看了，为何偏偏喜欢你？',\n",
       " '评论都是故事',\n",
       " '那些回不去的年少时光。',\n",
       " '这才是流行歌曲[强]',\n",
       " '同城[呲牙]',\n",
       " '看看评论，安静看',\n",
       " '那些翻着评论，却不评论的人，或许才是孤独寂寞的人吧，路过的陌生人 你好，愿你吃贪不胖，愿你懒惰不丑，愿你的情深不被辜负，愿你的余生都有人陪伴。[爱心]',\n",
       " '编出你的故事',\n",
       " '是啊为什么会偏偏喜欢你',\n",
       " '过于完美 易碎',\n",
       " '曾经因为一个人，连续几个月，每天不间断的循环这首歌，后面释怀了，再次听，已没有那么多感触，因为真正放下了',\n",
       " '前任在车里用半咸淡的粤语唱过，现在觉得他弄脏了这首歌?',\n",
       " '无论对谁，太过于热情，就增加了不被珍惜的概率。',\n",
       " '或许那个男的真的很有魅力也说不定，不是吗？',\n",
       " '[多多大哭]',\n",
       " '偏偏',\n",
       " '或许相比他，有人更爱我，更在乎我，更适合我，可是我不想去赌一把，我只想要他[心碎]',\n",
       " '野史八卦：这首歌是写给华仔的',\n",
       " '嗯，不够爱就放手。',\n",
       " '有没有自己才知道、',\n",
       " '好的实在太少 甚至趋于没有 现在娱乐致死[惶恐]',\n",
       " '还有王杰四个人合拍的',\n",
       " '也不能说全部唉',\n",
       " '这本书，，满满的回忆[可爱]',\n",
       " '[憨笑]',\n",
       " '“我喜欢你”是真的喜欢你；\\r\\r\\n“我爱你”等于我想透你。\\r\\r\\n[心碎][心碎][心碎][心碎][心碎]',\n",
       " '还是老歌好听',\n",
       " '@豆豆酱一枪ko你 喜欢你呀',\n",
       " '@Goderland- 喜欢你呀',\n",
       " '君生我未生 我生君已老',\n",
       " '当初我用这首歌向你表白 现在听却是因为你定亲了',\n",
       " '这首歌谁听了都会有共鸣！',\n",
       " '第一次听是在徐峥的《港囧》里，那时还没用网易云，一听就单曲循环了好多天，今天出现在了日推里，还是网易懂我啊',\n",
       " '听老歌',\n",
       " '妖精和妖怪怎么区分呢[多多调皮]',\n",
       " '[多多比耶][多多比耶]',\n",
       " '我以前喜欢的一个人跟我介绍自己的时候说 他名字里有两个字跟这位歌手相同',\n",
       " '愿煦风和日永远卫护着可爱的你，愿你带着满心的春笑回来。 ',\n",
       " '泽旺喜欢你',\n",
       " '大叔，您是40左右，这首歌83年，才36岁呢哈哈哈',\n",
       " '为什么呢',\n",
       " '陈思璇是我的女朋友 我要给她个家[多多比耶]',\n",
       " '我不理解现在的人分手后就像仇人一样需要去说对方的各种不好，不能在一起很可能谁都没有错，只是慢慢不需要对方了而已……',\n",
       " '  又是一年冬天，我们相识是在冬天，第一次见面，你的车里就在放这首偏偏喜欢你，后来我反复听，也反复偏偏喜欢你，直到好几年后的清晨日落，我一个人站在窗下，马路中间，某间咖啡馆，你经常去的小店，熟悉的旋律响起，泪如雨下，我是多想再见你一面。不知道你是否依然，偏偏喜欢我。',\n",
       " '和声像是童音',\n",
       " '?刘三金，快点来找我…',\n",
       " '充满期望同时充满恐惧 害怕重蹈覆辙 但是喜欢一个人要怎么克制啊',\n",
       " '我又为何偏偏喜欢你……',\n",
       " '曾经把粤语的经典唱到了原唱，现只是听听而已。',\n",
       " '为啥我从评论里感受到了老年人群的味道…',\n",
       " '好爱这首歌',\n",
       " '我觉得好好听耶',\n",
       " '我也喜欢你呀',\n",
       " '纪贯新唱给梁子衿点歌，后来梁子衿有骆向东，纪贯新有路瑶。而当时认识他们的时候陪在我身边的人却不在了。希望有朝一日，我也有我的匡伊扬',\n",
       " '来 听 听 我 的 歌 我 爱 你 们  ??',\n",
       " '罗琦琦张俊[心碎]',\n",
       " '哈哈哈哈哈，笑岔气',\n",
       " '偏偏痴心想见你',\n",
       " '总感觉物理量之间是一个渐变的过程，可为什么爱上你这么突然',\n",
       " '那还不点赞[奸笑][奸笑]',\n",
       " '他一定会单手开法拉利',\n",
       " '[可爱][可爱][可爱][大笑][大笑][大笑]',\n",
       " '深有所感，无言可语，为将深情，一付如水，倾之东流！',\n",
       " '恭喜你因为哥[幽灵]（调皮了）',\n",
       " '两人的歌曲风格不一样，张国荣的歌曲更加洒脱、陈百强的歌曲多了几分忧愁。',\n",
       " '真正的速度是看不出来的，比如树叶什么时候会变黄，婴儿什么时候会长出第一颗牙，你会什么时候爱上一个人。',\n",
       " '牛逼',\n",
       " '许小波一定和罗琦琦在一起了！！！',\n",
       " '我就知道我的评论又被淹没了',\n",
       " '嗯嗯[多多大笑]',\n",
       " '快点过去吧！',\n",
       " '就是很奇妙[多多捂脸]',\n",
       " '深有感触[多多难过]',\n",
       " '我又为何偏偏喜欢你。??',\n",
       " '现在的音乐新歌榜热歌榜top排行榜，都TM啥玩意儿啊……惆怅[汗]',\n",
       " '第一次唱给女朋友听，现在一个人独自回忆，一首歌一个故事',\n",
       " '小时候听错成“情义已一一失去”，就一直以为这是首很惨的歌',\n",
       " '还不识字的时候就会唱数鸭子，刚刚识字的时候就在听偏偏喜欢你，和很多很多歌',\n",
       " '爱而不得，还是忘了吧',\n",
       " '我头皮发麻',\n",
       " '我旁边的琦琦说他不知道',\n",
       " '那，男孩呢？',\n",
       " '我男朋友也用这首歌追到了我[可爱]',\n",
       " '还是老歌深情 嗯  学着唱给蒋哥哥听 会不会感动得以身相许 哈哈哈',\n",
       " '年纪大了，老歌停不下来了……\\r\\r\\n突然听懂一首歌\\r\\r\\n送给我最爱的那个你\\r\\r\\n祝安生',\n",
       " '就好像阳光穿过窗户 有那么一束光照进了房间 屋外是外婆与邻居闲聊 以前的时间啊慢的像小溪在流',\n",
       " '謝謝你。',\n",
       " '我22岁  我喜欢你.',\n",
       " '曾几何时收藏的时候评论还不过万,今天突然在推荐的歌单的里面出现了,我就猜这首老曲子被你们发现了,不开心啊[憨笑]',\n",
       " '我的长头发正在留 杜卡迪正在凑钱买 社会摇正在学 现在也会梳后背了 西装革履皮鞋我也都有了 耳洞我也打了 花臂满身我已经纹好了  煽情的歌曲和陈百强我也在听了  给我点时间请你不要爱上别人 好吗',\n",
       " '妈妈很喜欢的歌手',\n",
       " '前年冬天也有个人跟我了同样的话，一句“我喜欢你”比什么都珍贵。只不过当时的我，没有感同身受……错过咯',\n",
       " '好好活着，连同她的那份',\n",
       " '陈百强的音乐就像是带来了那种喜欢时心动的感觉\\r\\r\\n',\n",
       " '我离君天涯，君隔我海角',\n",
       " '嗯嗯',\n",
       " '谢谢[可爱]',\n",
       " '偏偏喜欢你啊',\n",
       " '千千阙歌你也是这么评论的…',\n",
       " '为何我的心不会死',\n",
       " '最喜欢的曲目之一',\n",
       " '今天的阳光格外好，不知道自己在寻找什么，又在逃避什么，不知道自己在想什么，不知道自己下一步该做什么，只是听着这首歌儿不停抹眼泪',\n",
       " '这个前奏已经值得一条评论',\n",
       " '分手了才听的歌。',\n",
       " '好きですよ！',\n",
       " '长安冷么',\n",
       " '喜欢',\n",
       " '传承下去，',\n",
       " '大家都满足你的两位数的愿望了，赶快截图删了吧',\n",
       " '我喜欢你，\\r\\r\\n从始至终，\\r\\r\\n认真且怂。',\n",
       " '现在经过老街，还有一些复古的店里会放这首歌，走在树荫下，听着这歌，很容易想到岁月静好这四个字',\n",
       " '太秀了叭',\n",
       " '19年了',\n",
       " '真的，这部小说，如果拍不好的话，还是希望保留原有的想象中的美好。',\n",
       " '进入社会后你发现自己还没有成年',\n",
       " '现在都是抖音快手的锅，中老年人都学坏了[大哭][大哭][大哭]，珍爱生命，远离快手',\n",
       " '推荐你好好听一下，可以当是修身养性了',\n",
       " '23[大哭]',\n",
       " '这首歌发行于1983年，是2018年里我听过的年代最久远的一首歌。',\n",
       " '《那些回不去的年少时光》我永远想象不出这部它被搬上荧幕的样子，乌贼妖娆李哥小波关荷陈劲张骏罗琦琦，还有好多好多我喜欢的人儿',\n",
       " '祝福你们能走到最后',\n",
       " '我高中有一位体育老师就叫陈柏强，他第一节课说他的名字和歌星一样让我们猜，最后公布答案时大家面面相觑，只有寥寥几人听过。香港歌坛老矣。',\n",
       " '大学期间最长的一次寒假，也是最后一个寒假，在候车厅等着前往芜湖的火车，真的突然间就长大了呢',\n",
       " '“一直觉得这世上告别仪式挺多，比如喝酒、旅行，或干脆痛哭一场，可是后来才知道，人生中大部分告别是悄无声息的，原来某天的相见，竟已是最后一面，此后即便不是隔山隔水，也没有再重逢。” ???',\n",
       " '喜欢一个人是没有道理滴，正好我偏偏喜欢你...',\n",
       " '17的我说什么了哈哈哈?',\n",
       " '猪头猪脑[亲亲][亲亲]@听一首粉色的歌 ',\n",
       " '离开床以外的地方都是远方',\n",
       " '为什么给我推这首歌？我才23啊！',\n",
       " '新的一年愿你卡里有钱,车里有油,心里有爱,脚底有风,有空来兰州找我喝酒 管醉。。 ',\n",
       " '[色][色][色]',\n",
       " '会有的，发生意外，也不要放手。',\n",
       " '??',\n",
       " '翩翩公子 恨生不相逢未见时',\n",
       " '我也是慢慢喜欢上这首歌的，之前一直听英文电音，类型真的差好大。他是我的初恋，我们还在一起，我很喜欢他，我希望我们能有未来。',\n",
       " '@杨吧嗒的BADA @Yuqqii ',\n",
       " '为何偏偏喜欢你，你还不明白',\n",
       " '她问我喜欢她什么，我不知道该如何回答她，就是通通都喜欢，见不到她就超级想她，见了她就满心欢喜。就想腻歪着她，黏着她，赖着她。但是我还是回答不出来她的问题，我总不能说偏偏就喜欢你吧[痛苦]',\n",
       " '以前说爱用行动，现在说爱用嘴巴',\n",
       " '同款经历',\n",
       " '我爸爸喜欢听老歌，每次开车出去车上放的音乐总是这首歌，小时候总是闹腾着要换歌，现在我爸爸开始在车里放一些流行曲，我心里总是空空的，老歌老歌，真好听啊',\n",
       " '你们有没有看过b站里面！哥哥在泰国曼谷唱这首歌啊啊啊！我的妈呀，哥哥太可爱了，全程忘词+即兴作词，气死陈百强系列[多多捂脸][多多捂脸][多多捂脸]',\n",
       " '我也在图书馆[多多耍酷]',\n",
       " '我妈说她当年迷陈百强迷得要死  然后偶然间整理东西看到以前她年轻时的日记里都有他 还有一些老得泛黄的照片里也都是她  每次一听到老歌就想起她 是啊  哎',\n",
       " '想哭…',\n",
       " '潘明峰是我现在年少的欢喜 我喜欢你 我的明恋不知道哪天会突然结束 但是没关系能认识你也够了 原来人真的可以对素未蒙面的人疯狂思念是真的 我说的每一次想你也是真的 为什么我敢在这里评论 因为反正你也看不到啊 哈哈',\n",
       " '因为她喜欢经典的歌，我慢慢觉得经典的歌也很好听，爱屋及乌吧，她离开了，把这些歌留给了我',\n",
       " '[爱心]想起了自己的经历，在图书馆看书看着看着就哭了。',\n",
       " '15年的时候看完港囧，觉得很好听，跟喜欢的男孩子分享这首歌，发出去后看歌名，偏偏喜欢你，突然发现歌名这么尴尬。都不知道该怎么面对他了。后来高中又到了同一个学校，我已经完全没有了那年的念想，可能这就是释然吧。',\n",
       " '[多多调皮]',\n",
       " '真的喜欢一听前奏，就能闭上双眼安静享受的那种感觉！',\n",
       " '小时候听过这首歌  时隔多年  依然在心里泛起涟漪',\n",
       " '像小溪在流',\n",
       " '爱已失去  一切都不对',\n",
       " '在听了谭晶和塔斯肯唱这首歌后，立马搜这首歌，无限循环，然后听陈百强的歌。好像总是这样，好歌太多了，有些东西总是需要人提起，你才知道，哦，原来有这个好东西。',\n",
       " '旧日情如醉 此际怕再追',\n",
       " '萝卜小姐 你这个坎儿我过不去了',\n",
       " '你觉着的珍贵但是你喜欢的那个人并不会……[心碎]',\n",
       " '你虽然说和我分手了，但我不知道为啥，偏偏喜欢你',\n",
       " '为何我偏偏喜欢你，分手三个月，我想去见你。',\n",
       " '还有王杰',\n",
       " '娴公主最喜欢的歌手唱歌果然好好听',\n",
       " '那个鬼蹦的那个视频，就是放的这首歌…有谁看过？',\n",
       " '在图书馆听着歌，看着评论，也不知道为什么莫名其妙就哭了，捂着嘴不敢大声哭[痛苦]',\n",
       " '手机里经典老歌里最爱',\n",
       " '开头的音乐好听的无法形容，不管换了几个手机，这首歌都在我的心里！虽然是首老歌可是喜欢的不行！',\n",
       " '.g',\n",
       " '有生之年遇到一个喜欢听这些歌的十八岁少年，诚如他所言，这些歌有故事，有感觉。',\n",
       " '罪过罪过',\n",
       " 'LGC',\n",
       " '夫人一词，真是美好啊～',\n",
       " '听得让我有一种洞房花烛夜的感觉',\n",
       " '偏偏喜欢你',\n",
       " '因为他喜欢这首歌，所以我也喜欢。',\n",
       " '就怕你跑不过你的十几亿弟兄啊。',\n",
       " '我好喜欢你鸭可是我讨厌你',\n",
       " '我好喜欢你呀，喜欢得看你的时候喜欢要从眼里跑出来了',\n",
       " '不爱你 不要想了',\n",
       " '还是这首歌难忘啊！！隔段时间就要听听！',\n",
       " '上职高的时候喜欢班上的一个玩得来的女孩子，就是恋人未满的那种关系，但还是说不出喜欢你这三个字。一直一直拖到了我辍学····，最后一次取得联系是她以为人妻，我只能以一句“现在过得还好吗”去跟她讲话，后来想想还是把她从QQ好友上删除了···',\n",
       " '我喜欢你',\n",
       " '彭伍英我爱你chend',\n",
       " '謝謝妳',\n",
       " '[强][强][强][强]',\n",
       " '那些翻着评论，却不评论的人，或许才是孤独寂寞的人吧，路过的陌生人 你好，愿你吃贪不胖，愿你懒惰不丑，愿你的情深不被辜负，愿你的余生都有人陪伴。[爱心]',\n",
       " '那些回不去的年少时光',\n",
       " '之前的歌，曲子中都带着岁月的悠扬。',\n",
       " '在十四岁那年学会的第一首粤语歌 诶 一晃十年了',\n",
       " '那些回不去的年少时光',\n",
       " '经典就是好听',\n",
       " '我以为没有那么喜欢你的，我知道你也看不到',\n",
       " '老哥，真好听',\n",
       " '第一次听这歌曲是5岁时候。如今也20多了。至少我知道的这首歌这么多年还是那么火，真的不敢想83年刚出时候是多么欢迎，车里手机里家里音响电脑基本都是丹尼的歌。',\n",
       " '今天听了很多遍这首歌，以前，偏偏喜欢你，以后，相忘于江湖，再也不见',\n",
       " '别忘记了还有王杰！！！',\n",
       " '三太子都没了',\n",
       " '我又为何偏偏喜欢你',\n",
       " '把我带去了你的时代。',\n",
       " '也许只有经历过的人，才会对偏偏喜欢你情有独钟',\n",
       " '也许家驹跟百强是命中注定吧，愿你们在天堂一切安好！',\n",
       " '那些回不去的年少时光 那个傻傻的小琦琦，那个坏坏的小张骏 那是他们的年少时光 最美的时光',\n",
       " '偏偏喜欢吴克?',\n",
       " '一代有一代的歌',\n",
       " '偏偏喜欢你，偏偏，喜欢，你\\r\\r\\n读起来，都感觉曾经好累。',\n",
       " '90后也是喜欢呀，老哥歌越听越有味',\n",
       " '罗琦琦和张骏。',\n",
       " '你还记得么，这是咱们俩第一次见面在电影院看电影的主题曲，当这首歌想起时你没有顾忌周围人的眼光，肆无忌惮的亲吻了我，那个吻太甜了。三年时匆匆过去，我还记着单当初那个你呢',\n",
       " '经典中的经典',\n",
       " '终于登录成功为我的至爱陈百强加添评论了。这首偏偏喜欢你没有人能拷贝丹尼，他是唯一！',\n",
       " '经典',\n",
       " '之前常常听这首歌，喜欢的人还在身边，暗恋很久不敢表白，但天天找人家聊天也是很开心，2年过去了，久不联系，才发现已被对方删除好久，不知道自己为何会久久不能忘，可能是自己第一个喜欢的人',\n",
       " '你没什么好的呢，那个曾经相互伤害的朋友，为什么此时此刻又想到了你。',\n",
       " '没有什么意外 就是偏偏喜欢你',\n",
       " '为什么十五岁的我爱听这种歌?[大哭][大哭]',\n",
       " '我昨晚又梦见你了',\n",
       " '我是90，喜欢',\n",
       " '我不喜欢你了\\r\\r\\n也不想遇见你了',\n",
       " '不想单身了',\n",
       " '经典',\n",
       " '不好意思~我五千多次了~车上耳机~没事就听着跟着哼',\n",
       " '那张合影还有王杰  谢谢',\n",
       " '人生百态，浅尝辄止，喜你如初。欢迎你，我的爱人',\n",
       " '我是97年的，我的年度歌手是陈百强，《偏偏喜欢你》今年在网易云上听了近500次。这首歌我听了有10年了，由这首歌喜欢上陈百强，最喜欢的歌曲，没有之一。',\n",
       " '偏偏喜欢你啊',\n",
       " '真的假的',\n",
       " '沉迷于经典粤语歌曲中无法自拔',\n",
       " '我也是',\n",
       " '高中午休起床学校广播的第一首歌，现在过了三年听到的第一反应还是起床。。。',\n",
       " '我会唱，可是没有喜欢的女孩',\n",
       " '还有男生会对喜欢的女孩子唱这首歌吗？',\n",
       " '如果有男孩子对我唱起这首歌，并且人品好，那就是我以后值得托付的人了。这首歌简直直击心灵??',\n",
       " '我钟意你 Xly',\n",
       " '喜欢一个人的时候，变得多愁善感了。',\n",
       " '98的',\n",
       " '偏偏喜欢你，没有原因，也没有结局，希望你过得好！',\n",
       " '如今社会哪里还有这么羞涩的爱情故事',\n",
       " '谢谢你兄弟',\n",
       " '我很抱歉，点了赞，又泛起了你的伤痛回忆。',\n",
       " '旧日情如醉，此际怕再追\\r\\r\\nzhj我喜欢你',\n",
       " '虽然我是00后，但是我觉得老歌挺好听',\n",
       " '我也不知道为什么会喜欢，就是偏偏喜欢你，没有你就很难受的那种。\\r\\r\\n   今天是没有我的第22天，不知道你怎么样，反正我现在依然有点心塞。',\n",
       " '真正的速度是看不出来的，比如树叶什么时候会变黄，婴儿什么时候会长出第一颗牙，你会什么时候爱上一个人。',\n",
       " '歌曲容易忘记，忘不掉的只是回忆罢了！',\n",
       " '废话一样 ，英年早逝的多了，也没见你们都悼念一遍',\n",
       " '有  95后也有?',\n",
       " '都知道四大天王现在很少人知道三皇一后了',\n",
       " '偏偏这野火烧不尽，春风吹又生',\n",
       " '年度最老的歌',\n",
       " '雷打不动',\n",
       " '有90后喜欢这首歌的吗[女孩][女孩][女孩]',\n",
       " '一次又一次\\r\\r\\n不知所谓的熬夜到很晚\\r\\r\\n开始习惯生活中不合理的种种\\r\\r\\n不分黑白\\r\\r\\n说服自己与我无关\\r\\r\\n好的发生了就会开心\\r\\r\\n不好的来了便也去接受\\r\\r\\n想想\\r\\r\\n人活着\\r\\r\\n总得活着吧\\r\\r\\n\\r\\r\\n\\r\\r\\n',\n",
       " '这首歌从小听到大，怀念。',\n",
       " '这两天和静哥哥有点不开心\\r\\r\\n可能太在乎了情绪就多了\\r\\r\\n有时候是我考虑不周到...有时候是我做的不够好...\\r\\r\\n还有我太玻璃心了\\r\\r\\n好在今天都已经讲清楚了?(｀???)\\r\\r\\n嗯 关于朋友  我很珍惜',\n",
       " '偏偏喜欢你',\n",
       " '可是我就是喜欢你呀',\n",
       " '人家不一定是这首歌一出的时候啊，就像现在如果用这首歌追一个女孩子生出来的孩子四十岁嘛？',\n",
       " '有没有00后阿我03的一起推荐好歌阿（受不了现在的歌）',\n",
       " '十几年坚守，只愿一颗真心如初',\n",
       " '甜甜[亲亲]',\n",
       " '   刚认识你的时候 就是跟在你的身后  后来和你在一起了  我要一直跟在你身后 一辈子 偏偏痴心想见你 偏偏喜欢你?',\n",
       " '突然想听了，嘿嘿',\n",
       " '我我也是',\n",
       " '1983年',\n",
       " '这首歌是什么时候的',\n",
       " '我也是',\n",
       " '一天听了141次，最老的歌',\n",
       " '好兄弟的婚礼，我提前去了你家，你家很大，房间很多，我无意中闯进你黑暗的房间里，隐约中看到你抬起头。第二天看到你像一个小精灵一样跑来跑去，沉寂了两年多心就被你撩起来了，多看你几眼更加不能自拔，也许就是缘分，我每天望着手机期待你的信息，期待你的语音让我的房间充满温。骗骗喜欢你。',\n",
       " '哈哈哈',\n",
       " '一天听了83次……',\n",
       " '年度播放最多歌曲…唉！',\n",
       " '你四十岁？？',\n",
       " '现在的男人都怎么了，你向我表白我就必须接受吗，可我就是不喜欢你啊，在你眼里就成了喜欢有钱的帅的看不起你了？我不喜欢你你无论多有钱多帅跟我有毛关系？还扬言说什么将来你挣钱有出息了让我后悔？拜托，我后悔什么，凭什么你向我表白我拒绝就感觉我犯了多大错一样？老子一个大男人只喜欢女人有错？',\n",
       " '为何我偏偏喜欢你',\n",
       " '这是我的年度歌单，我听了73次@高小圆M',\n",
       " '我也',\n",
       " '偏偏喜欢你',\n",
       " '好巧噢 我也是',\n",
       " '我也是',\n",
       " '我也是[多多笑哭]',\n",
       " '听了4年，每次去KTV都唱，把身边的朋友都带会了的一首歌[大笑][大笑]',\n",
       " '一生太短暂，遇到喜欢的人就要认真喜欢。',\n",
       " '听了四年了',\n",
       " '今天报告显示这是我听的年代最远的歌[色]',\n",
       " '刚刚因为这首歌 遇到了一个人 才开始 就因为我不小心点了返回 然后找不到了',\n",
       " '偏偏喜欢你@青春陪你散',\n",
       " '翻开高三的课本，第一面就写着我又为何偏偏喜欢你。我当时又喜欢着哪个可爱的女生啊。',\n",
       " '是什么让我在18年的某一天听了81遍？[惊恐]',\n",
       " '楼下有人称他用这首歌追到了他太太，人齐了',\n",
       " '我想问问云村的家人们，年会唱这个歌说什么开场词？',\n",
       " '我也喜欢你',\n",
       " '偏偏喜欢苏中玉?',\n",
       " '偏偏喜欢你',\n",
       " '每次听到这首歌心都会软的像一摊水，嘴角控制不住的上扬',\n",
       " '竟然是网易云上听过最久远的一首歌',\n",
       " '我不敢听现在的流行音乐，因为那么的撕心裂肺，喜欢听老歌，因为相信回忆里的你是甜的。',\n",
       " '偏偏喜欢你～',\n",
       " '封面是VAN?',\n",
       " '华南植物园。????????',\n",
       " '偏偏痴心喜欢你',\n",
       " '罗琦琦和张骏坐着火车回去的时候，听着这首歌，两个人可能都在想为什么偏偏喜欢你，可是年少时的感情不就是这样，来的莫名其妙、猛烈突然吗？',\n",
       " '风月都好看，爱恨都浪漫。',\n",
       " '隔段时间听一次',\n",
       " '6666～每日推荐随机到的第一首[撇嘴]……熟悉的港台剧歌曲，原来是这个歌名，原谅我一直没听懂粤语！！',\n",
       " '已经离开了。',\n",
       " '想起了小李飞刀',\n",
       " '废话   果断收',\n",
       " '方天画戟 苹果',\n",
       " '我却为何偏偏喜欢你',\n",
       " '偏偏喜欢你，即使在你说出你不喜欢我时，我也依然会说我偏偏喜欢你。无论爱情还是友情。我就是偏偏喜欢你',\n",
       " '你喜欢我，像党的宗旨，全心全意；\\r\\r\\n\\r\\r\\n我喜欢你，像新闻联播，没有结局。[多多难过]',\n",
       " '喜欢！',\n",
       " '慢慢习惯了没有你',\n",
       " '偏偏喜欢你',\n",
       " '12年3D版泰坦尼克号重映，和相恋四年的她去看零点首映，结束后她去给我买水，被一辆酒驾车撞飞，抢救无效。现在是2019年1月3日，她去世已经6年9个月4天，听着这首歌，如今27岁的我，多么想念永远20岁的她。杰克对露丝说，赢得船票是他最幸运的事，我想对天国的她说，遇见你，是我最幸运的事……Miss 你',\n",
       " '《偏偏喜欢你》，歌曲的创作灵感来源于张德兰的《情若无花不结果》1989年为了参加东京音乐节，陈百强请周启生给他编一首像《情若无花不结果》那样中国风的曲，于是，周启生特意为《偏偏喜欢你》编了一首新曲子Danny很喜欢这种中式的小调',\n",
       " '差了19岁   他说   就想唱一首歌给我  偏偏喜欢你',\n",
       " '厉害了[多多大笑]',\n",
       " '为啥给我听这个？我是收藏还是不收藏?',\n",
       " '我不知道你用不用网易云，也不知道你看不看的到，不论怎么样，我还依旧爱着你。',\n",
       " '看到你这句评论心里有一种酸酸的感觉，喜欢一个人的样子是真的很好看的。在感情里面歇斯底里的样子太丑，无法挽留就要学会放手。总是一次次在深夜里崩溃，希望自己能够脱胎换骨放下对他的执念，知道自己也是一个抗不过感情的俗人。平安喜乐，万事胜意这句话送给还在我心里的男孩也送给你~安好~',\n",
       " '听到这首歌真的好怀念小时候坐在妈妈车上 那时还不够年纪做副驾驶 车头放进几张碟 都是妈妈学生时代的歌 感叹自己才知道 原来妈妈也有追星的青涩年华',\n",
       " '收到!',\n",
       " '我邀请了缪喵喵听歌 偏偏喜欢你',\n",
       " '预知了所有悲伤，但我依然愿意前往',\n",
       " '某人正在听我推到这首偏偏喜欢你，你懂不',\n",
       " '偏偏喜欢你[大哭]',\n",
       " '以前的歌曲靠嗓音天赋气息，现在歌曲靠机器难道不是吗？',\n",
       " '我要学会这首歌，等求婚那天唱给她听[憨笑]',\n",
       " '一万多条，唯有你的评论让我觉得很幸福',\n",
       " '怀念',\n",
       " '以前的味道现在怎么也找不到了',\n",
       " '偏偏痴心想见你',\n",
       " '这是我们伦巴basic的考试曲目，现在听到就发慌[大哭]',\n",
       " '秀啊同学！',\n",
       " '听翻经典，心中满是惆怅',\n",
       " '可惜有几位离去的太早，令我心碎?',\n",
       " '[呲牙]画面感很强',\n",
       " '我不管、反正我就是喜欢你',\n",
       " '他在那头哼着偏偏喜欢你的曲调，我说好适合哄人入睡，他说是啊，我就是那么哄着那个女孩的',\n",
       " '[多多比耶]',\n",
       " '经典',\n",
       " '怎么会偏偏就是你。。',\n",
       " '偏偏二字，真是无可奈何啊……',\n",
       " '书友啊！我也是几年前看书认识的歌曲',\n",
       " '真正喜欢一个人，哪有那么多理由，我就是偏偏喜欢你',\n",
       " '我学生时代最爱的歌手啊[流泪][流泪][流泪][流泪]',\n",
       " '桐华的《那些回不去的少年时光》',\n",
       " '那些回不去的年少时光',\n",
       " '喜欢这首歌的都去听听陈百强其他的歌吧，惊为天人，墙裂推荐！！！',\n",
       " '喜欢听老歌，不喜欢交往，就静静的呆着，网易云把我引上一条孤独的道路',\n",
       " '终于看见一个书友了，还是老乡，哈哈',\n",
       " '大猪蹄子给我推荐[多多捂脸]',\n",
       " '愿一切都好',\n",
       " 'Danny,元旦快乐哦，你在那边好吗？和哥哥一起要快快乐乐的啊',\n",
       " '[爱心]',\n",
       " '一本小说',\n",
       " '张峻罗琦琦出处是什么',\n",
       " '突然眼泪就流出来了',\n",
       " '好深情啊',\n",
       " '2019 期待爱情',\n",
       " '是空空荡荡，却嗡嗡作响。',\n",
       " '打卡',\n",
       " '我也不相信',\n",
       " '应该是四人合照，还有个黄家驹?',\n",
       " '在2018年最后一天家驹我代替兄弟们去拜祭了，百强替妈妈也去看了，了去我多年心愿，音乐不死，随世流传，加油华语乐坛',\n",
       " '只想对你说一句，偏偏喜欢你。',\n",
       " '今年的计划，脱单[大哭]',\n",
       " '亲爱的姑娘，我就在无人晓得的地方祝福你。\\r\\r\\n元旦快乐!\\r\\r\\n我多希望能和你一起跨年',\n",
       " '那所以你相信吗？我是不信。',\n",
       " '粤语歌经典中的经典，唯独不可缺这首，偏偏喜欢你，真的非常偏偏的喜欢你[亲亲]',\n",
       " '少年时代两次告白都失败了。现在已经没有了以前的勇气了。',\n",
       " '为何我偏偏喜欢你',\n",
       " '98年上卫校时听过，一听这首歌就会想起那时候的情景，20年过去了，刚才在同学群里，一波红包外带一轮表情包过后，又平静如水。',\n",
       " '百听不厌[多多大哭][多多大哭]',\n",
       " '我还是那么古板，就算电子书兴起，但我还是喜欢看纸质书。繁华的快节奏，人们越来越懒得去从本质了解了。以前有个MP3能把里面的歌唱到自己倒背如流，现在不行了，不行了。',\n",
       " '没人注意到作曲人吗[奸笑]',\n",
       " '[大笑]我路过',\n",
       " '363-偏偏喜欢你',\n",
       " '2018最后一天，许愿明年能有个人让我唱给ta听吧。',\n",
       " '自从那天被拒绝之后直到现在想了很久，爱一个人不是只有付出就会有收获的，不是一厢情愿的，切不可着急，要细水长流，慢慢品味。',\n",
       " '得不到的永远是最好的',\n",
       " '牵手嘛[多多难过][多多难过]犹豫不决',\n",
       " '地球上77亿人，284个国家，809个岛屿，两人遇见的概率是2千9百20万分之一，所以很感谢遇到你，你遇到那个她，都是你命里该遇到的人，绝非偶然，她的出现，一定会教会你什么，所以你要感谢遇到那个她。[愉快][愉快][愉快]',\n",
       " '祝安好',\n",
       " 'BC\\r\\r\\n过了明天就是喜欢你的第4年了吧\\r\\r\\n明年的高考你要一如既往的优秀\\r\\r\\n2020我会来到有你的那个城市\\r\\r\\n就是偏偏喜欢你  然后成了一种信仰',\n",
       " '在一家火锅店听到了 不自觉地跟着唱 听起来很雅致',\n",
       " '刚好，我也在听',\n",
       " '刚好，我也在听',\n",
       " '好听好听',\n",
       " '听这首歌莫名的想起以前喜欢的人，那时候真的是不知道为什么就是偏偏喜欢你，想不起你有多好',\n",
       " '有没有人教我正确的粤语发音，我要唱给她听',\n",
       " '我是听村里广播',\n",
       " '不希望我成为下一个你',\n",
       " '偏偏喜欢你',\n",
       " '不知道为什么 听到这歌竟有想落泪的冲动。',\n",
       " '我最喜欢的粤语歌，没有之一……',\n",
       " '为何我心分秒想着过去，为何你一点都不记起。我们回不去了，我时时刻刻都在我们以后不能在一起的心碎中度过。',\n",
       " '爱已是负累，相爱似受罪。心底如今满苦泪。旧日情如追，此际怕再追。偏偏痴心想见你。自爱上你后，听这种歌，感同身受。',\n",
       " '真的很讨厌现在那些无病呻吟的所谓情歌，时代的退步[撇嘴]',\n",
       " '现在的音乐人再也创造不出这么好听的音乐了',\n",
       " '港囧',\n",
       " '小时候摔倒了，要看周围有没有人，有就哭，没有就爬起来，长大后摔倒了，要看周围有没有人，有就爬起来，没有就哭',\n",
       " '我们班主任昨晚也唱了[大哭]',\n",
       " '谢谢你',\n",
       " '那个年代的纯真歌曲啊，现在情歌都学着点',\n",
       " '下载要会员晕，现在什么都要钱',\n",
       " '说得真好啊！哎，看看现在的社会成什么样子了……以前的歌真好听！现在全是垃圾。',\n",
       " '看到作词作曲都是国人，心中对这首音乐不禁又喜欢了一分[憨笑]',\n",
       " '喜欢评论有水平',\n",
       " '真情，不浮誇，發自肺腑\\r\\r\\n請不要讓這些成為那個年代的特產\\r\\r\\n致敬陳百強[拜]',\n",
       " '现在的歌手不识几个，最是远去的人念念不忘',\n",
       " '据听说，是因为他当年喜欢的女孩叫“偏偏”，所以有了这首歌～',\n",
       " '偏偏    大概是有种爱而不得的意思',\n",
       " '[多多可怜]',\n",
       " '也有可能是见色起意[大哭]',\n",
       " '偏偏喜欢你[可爱]',\n",
       " '最近都喜欢听老歌，是自己老了吗',\n",
       " '高三元旦联欢的时候，我们班主任一个很严肃的数学老师还是年级主任给我们唱了这首歌特别好听，现在想想真是怀念',\n",
       " '黄家驹31岁，你走之后香港再无音乐天才\\r\\r\\n李小龙33岁，你走之后世上再无功夫之王！\\r\\r\\n陈百强35岁，你走之后世上再无偶像歌手！\\r\\r\\n梅艳芳40岁，你走之后世上再无女人花！\\r\\r\\n邓丽君42岁，你走之后世上再无一代天后！\\r\\r\\n林正英45岁，你走之后世上再无僵尸片！\\r\\r\\n张国荣46岁，你走之后世上再无一代巨星！',\n",
       " '不可以',\n",
       " '什么是一见钟情？我觉得是在你脑海中不断出现并且符合你各个方面的人，然后你在现实中遇到的那人正好和你脑海中那个人重叠了，这才是一见钟情。',\n",
       " 'DannyChen。(? ???ω??? ?)',\n",
       " '就像玫瑰偏偏代表爱情 而我 偏偏喜欢你',\n",
       " '我鍾意你、我愛你、正經啲點都一定傳到對方個心',\n",
       " '那我还可以遇到吗？?',\n",
       " '现在也是啊！',\n",
       " 'sad',\n",
       " '你没遇到我',\n",
       " '@反正你也不认识i',\n",
       " '只剩谭咏麟啦',\n",
       " '忍不住复制粘贴你的话，时代中的情话泛滥成灾，可是真情的还是它的味道，只是要遇见互相欣赏的人，',\n",
       " '陈百强我很熟悉的名字，悄悄喜欢你是我喜欢的乔恩的电视剧和里面的插曲，当我听到这首歌，熟悉的旋律一起，我真的起鸡皮疙瘩了，也算是一个中华小曲库的我了，对歌还是爱的真切，经典真的就是经典',\n",
       " '喜欢这首歌的女孩子不多吧！我怎么没遇到过，我最拿手的一首歌，靠这首歌获好评?',\n",
       " '[西西心动]',\n",
       " '不哭',\n",
       " '以前的味道也适合现在的人\\r\\r\\n',\n",
       " '50秒后面那一段太好听了吧',\n",
       " '喜欢的少女是你啊c',\n",
       " '我男朋友比我大超级多 他第一次唱这首歌给我 超级感动 感恩有你',\n",
       " '吾生之欢喜，半是清风明月，半是你。',\n",
       " '在这首歌下看到琦琦和张骏...感动',\n",
       " '我好遗憾。',\n",
       " '要是我那个时候，有这种想法就好了。那时候想以后如何如何，有些话可以以后讲，有些事可以以后一起做。哪里知道，以后没有以后呢。',\n",
       " '那么多适合的人我却偏偏喜欢你',\n",
       " '厉害，都说爱情是从借书开始的，你是从卡带',\n",
       " '每日一顶',\n",
       " '99也如此',\n",
       " '我可以给不喜欢的人发“么么哒”，可以给别人半开玩笑的说“约吗？”，但是那一句“我喜欢你”却始终只对我喜欢的人说',\n",
       " '[流泪]',\n",
       " '你怎么知道你不是那个人，请不要为你的不喜欢她而找借口?',\n",
       " '有一个女孩儿，她对我说了这句话，可我却没有把她留在我身边，因为我知道，相比我，有人更爱她，更在乎她，更合适她，与其把她留在身边，让她赌这一把，不如让她选择更稳妥的，我的祝福，会是最最真挚的',\n",
       " '兄弟 这口味常人不需理解',\n",
       " '小时候寄居在亲朋戚友家，有一个叔叔家总是回放港台的音乐，从此喜欢听歌，长大再听到这些音乐，感觉经典就是经典，太好听了[憨笑][憨笑][憨笑][憨笑][憨笑]',\n",
       " '早上经过商场时听到突然觉得真的好听，以前咋没发现呢[大哭]',\n",
       " '一见钟情 不过是见色起意',\n",
       " '为何为何',\n",
       " '就让思念疯狂生长吧，随他吧',\n",
       " '四年了，在这首歌又见到了你，那个曾经我暗恋的女孩[哀伤]',\n",
       " '98年的也一样?',\n",
       " '当年张峻在罗琦琦的耳朵里塞的耳机放的就是这首歌',\n",
       " '2018.12.29日1.57偏偏喜欢你爱你?????',\n",
       " '你相信一见钟情吗？',\n",
       " '我居然才找到这个歌单，其他的歌都已经听不下去了。哎，92都老了，时间过的真快',\n",
       " '一样大哦！我也喜欢老歌',\n",
       " '真的超级喜欢粤语的感觉啊很舒服',\n",
       " '我比你大12岁[大笑][大笑]',\n",
       " '[心碎][心碎][心碎]',\n",
       " '我97年出生 从小到大喜欢70年代以后的所有粤语歌曲  我同学朋友都说我不是90末的人……',\n",
       " '我不会失望，只要她好好的，比啥都强',\n",
       " '曲中人，我还是很喜欢你',\n",
       " '听听老歌  回忆那个年代 ??我很喜欢上个世纪八九十年代新旧气息交杂的港风',\n",
       " '再听已是曲中人',\n",
       " '第二遍读的时候，觉得这本书写的超级好。不单单是爱情。涉及社会中的各种现象。',\n",
       " '打卡',\n",
       " '[憨笑][憨笑]',\n",
       " '感觉好像回到乡下外公的家，然后他们的老播音机在播这首歌',\n",
       " '不能再有含量',\n",
       " '好像是这个道理',\n",
       " '元旦迁居，居然连三个晚上四点不到醒来就睡不着，这也是一种病；还好可以听听老歌，看看评论里的故事，挺多感触……',\n",
       " '第一次听黄家驹我没哭，后来哭了，次次哭。君生我未生，我生君已老。希望能借着一股力量让自己在未来更努力的活吧',\n",
       " '半夜坐在火车上，不知道听什么，心里想着一种旋律，或许无意间，遇见他，遇见一个时代，遇见一个人，心情就此定下了，或喜或悲或期待或遗憾，都是美好的8??，没有什么是回忆不能治愈的，或许也是回忆里的自己治愈了现在的自己，忍不住的想哭，想不明白为什么，希望是对以往苟活和未来憧憬的开心吧',\n",
       " '为什么现在越来越喜欢听老歌？不是因为我们老了，而是因为我们长大了！',\n",
       " '我先去趟厕所 一会我回来要看到这首歌的谐音翻译 如果没有的话我会打死在座的各位或者把在座的各位打死',\n",
       " '这就是你答应过什么事都跟我说，你真的不知道老子在想这个星期带你去哪里玩 你在准备多久跟我分手\\r\\r\\n你知道我满心欢喜下来给你送红糖水你给我说你和好了我脑子都不相信我耳朵 眼睛里的泪都包不住了。',\n",
       " '今天知道她有新的男朋友了，个子高高长的很帅。很高兴也失落，祝你余生。。。',\n",
       " '天呐，原来这么多人看过这本书，好开心啊',\n",
       " '为何偏偏喜欢你',\n",
       " '偏偏喜欢你',\n",
       " '儿时回忆',\n",
       " '这一年，遇见你，缘分使然嘛',\n",
       " '为什么有些人明明知道没有结果，，还是忍不住要去奋不顾身',\n",
       " '305次，，，自从认识你，自从认识这首歌',\n",
       " '老歌好听',\n",
       " '本周听的第63次。。看到数据时自己都吓了一跳。。',\n",
       " '你不失望就是最好的啦',\n",
       " '为何遇到的是你，为何偏偏喜欢你',\n",
       " '她生病了，今天我要过去看她，希望能看到她，就算不能见面，也要把祈福带给她。祝我成功吧\\r\\r\\n第一次见到她，我好紧张。借大家吉言',\n",
       " '真的很难过   在他们走过后  我才认识他们???',\n",
       " '不是，好歌不包括任何时代的歌曲。现在的好歌叫流行，以前的好歌叫经典。来自99年的小哥哥[可爱]',\n",
       " '经典真好',\n",
       " '我说我想说的关你什么事。。',\n",
       " '是啦[大哭]',\n",
       " '你说你喜欢以前的歌，我想说，我喜欢以前的你，喜欢现在的你，爱以后的你。     AYP＊QSX',\n",
       " '我又为何偏偏喜欢你。',\n",
       " '你知道黄凯芹  给你一个赞',\n",
       " '还有；大佑！冠杰！冠英！家驹！凯芹！家强！世荣',\n",
       " '请不要刷无含量的评论',\n",
       " '那些回不去的年少时光！',\n",
       " '你唱的。最早的。情不知所起。一往而深',\n",
       " '我还是一如既往的喝着喝着冰可乐，听着歌看着视频，你呢？',\n",
       " '那张照片上还有王杰',\n",
       " '有回忆就是有意义',\n",
       " '一直以为陈百强就是陈百祥[呆]',\n",
       " '乍一看还以为是VAN',\n",
       " '偏偏就是喜欢你',\n",
       " '偏偏喜欢你',\n",
       " '前奏再一次迷倒我',\n",
       " '照顾一个人的感受是一下子抛出好几个话题让她回答自己想说的才不会尴尬  假装不费劲其实有用心才会这样吧',\n",
       " '经典',\n",
       " '好听啊，从来不知道老歌也很好听',\n",
       " '我喜欢那个时代    那个周星驰   吴孟达   周润发   刘德华……的时代    感谢他们缔造的那些经典   陪伴我每一个悲伤难过的时刻    谢谢',\n",
       " '你说过我的歌单里不适合你',\n",
       " '醒啦，宝宝，偏偏喜欢你，小苏',\n",
       " '希望大家的爱都能有始有终，不被青春辜负，不被时光携走！',\n",
       " '偏偏喜欢你，',\n",
       " '张米雪，圣诞快乐，喜欢你',\n",
       " '很喜欢这种细水长流的真情  感觉满腔的热血，变成浓浓的爱意……真真的淡淡的……',\n",
       " '那时候爱情都炙热，那时候的歌里都是真心',\n",
       " '秋官是不是郑少秋来着[大哭]',\n",
       " '丹尼，圣诞快乐！',\n",
       " '阿金',\n",
       " '自己的感受又何必放在别人身上，有的人没放下，抒发自己的感受而己，请至少尊重下别人的心情吧，怎么生活，放没放下，人各不同',\n",
       " '愿你们住心里的人 以后也能住家里！\\r\\r\\n而我！心里无人.家里无人.四海为家！\\r\\r\\n哈哈哈哈哈哈哈哈哈哈哈[心碎]',\n",
       " 'lyy',\n",
       " '强人锁男？',\n",
       " '学友！校长！哥哥！克勤！百强！王杰！别安！凯芹！冠杰！慧娴！草蜢！黎明！罗文！医生！国权！枫华！华仔！王菲！子祥！丽君！小凤！艳芳！瑞强！冠廷！正杰！吕方！富城！朝伟！瑞恩！美云！国祥！一下子打出那么多，爽！这些都是我的最爱，虽然叫他们的两个字有点别扭（广东人一般隘距地英文名）',\n",
       " '真是好听[大笑]',\n",
       " '这首歌里面好多粤曲元素',\n",
       " '人多的时候不好意思照镜子\\r\\r\\n没人的时候才放“自己”出来\\r\\r\\n一个人走路总是习惯走很快。\\r\\r\\n不小心和陌生人对上眼神就赶紧躲开\\r\\r\\n人多的地方不喜欢去\\r\\r\\n一个人呆又怕孤单\\r\\r\\n习惯性礼貌微笑\\r\\r\\n不是很会说话\\r\\r\\n不擅与人交际（但有几个很铁的朋友）\\r\\r\\n不会卖萌 不会耍乖\\r\\r\\n不会甜甜的笑\\r\\r\\n有人觉得太呆\\r\\r\\n有人觉得太冷',\n",
       " '好听！',\n",
       " '可你是个男孩子啊',\n",
       " '经典就是经典',\n",
       " '对的',\n",
       " '偏偏喜欢你。以后再告诉你吧',\n",
       " '秀儿，是你吗？',\n",
       " '说明你也是美女[可爱]',\n",
       " '[多多可怜]',\n",
       " '丹尼',\n",
       " '能听哭(?；ω；`)',\n",
       " '来人呐，把本座的东皇钟抬上来为这位秀儿撞一首东风破。',\n",
       " '清纯贵公子陈百强先生',\n",
       " '秀儿？',\n",
       " '安徽妹子都是这么可爱的',\n",
       " '[亲亲]',\n",
       " '偏偏喜欢你 没有办法',\n",
       " '秀儿',\n",
       " '是个狼人',\n",
       " '偏偏中意你',\n",
       " '听听当年的经典，再听听现在的粤语歌，唉都是泪。。。',\n",
       " '何必呢，一个人过着不也挺好的么，从上一段感情到现在六七年了，我一个人也很好啊',\n",
       " '妈呀',\n",
       " '我强制自己封存起关于你的记忆，可是听这首歌的时候我还是很想见你。',\n",
       " '在我还小的时候爸妈离婚的前一天，我妈走的前一晚放了这首歌。',\n",
       " '我以后就跟别的男孩子玩了，我会跟他讲笑话，跟他撒娇，问他要抱抱啦。从此没有你了',\n",
       " '??',\n",
       " '真巧，我就是绍兴的',\n",
       " '哈哈哈哈',\n",
       " '可以的可以的',\n",
       " '想找一个偏偏黑凤我的人',\n",
       " '又一个桐大大的粉[多多捂脸]',\n",
       " '就在刚才，突然之间，你告诉我你要结婚了，我没有想过这一天来得这样急促，奈何造化弄人，这条路总不会有结果的，你退出去是一件好事，再也不必在泥潭中越陷越深，不用怕到最后自己都会丢掉，只是我为何偏偏喜欢你呢?可惜我们都是男的呀，只希望来世再见了，愿你一切都好zxh.',\n",
       " '好听[多多可怜]',\n",
       " '永远不会忘记的丹尼',\n",
       " '痴心想见你?',\n",
       " '为何我却偏偏喜欢你',\n",
       " '去找找看看！',\n",
       " '看了几百条评论，就看到你一个同城',\n",
       " '现在结婚什么都是新的，就是新娘不是。',\n",
       " '除了睡觉，有空就听这首歌。最近迷上了',\n",
       " '说句操蛋的话，我们要相信爱情',\n",
       " '以前做的最对的一件事就是下载了网易云。',\n",
       " '不是喝不醉，而是缺少勇气。',\n",
       " '祝你幸福[可爱]',\n",
       " '偏偏喜欢你，讲不出再见，无言的爱，我偏不敢说',\n",
       " '那些回不去的年少时光',\n",
       " '无法想象 封面去拍陈真既视感',\n",
       " '我上铺的女朋友叫李偏偏，她爸肯定是以前这首歌听多了，才给她取的这个名字[大哭][大哭][大哭]',\n",
       " '最近两天忽然又梦到了你，如果时间回到5年前，你会喜欢上我吗？',\n",
       " '经典的魅力，永不会消逝',\n",
       " '今天梦见他三次 是他在遗忘我吧[哀伤]',\n",
       " '唉?老了',\n",
       " '98年前来报道\\r\\r\\n对这些经典金曲真的难以割舍',\n",
       " '变老了?',\n",
       " '连我都老了[皱眉]',\n",
       " '老了老了',\n",
       " '是我开始老了吗?',\n",
       " '04年的[多多捂脸]',\n",
       " '好爱好爱好爱这首歌???',\n",
       " '你有你喜欢的颜色 喜欢的形状 喜欢的声音 喜欢的零食 喜欢的电影 喜欢的衣服 我也有好多啊 比如你啊 你啊 你啊 ???',\n",
       " '96前来报道',\n",
       " '唉。',\n",
       " '粤语真的是让人感觉是舌尖上的缠绵啊。',\n",
       " '00后',\n",
       " '这首歌怎么循环不腻呢',\n",
       " '为什么我偏偏喜欢你',\n",
       " '真的是这样',\n",
       " '一万个赞',\n",
       " '一个94年的人，为什么会越来越喜欢这些父辈的流行曲？？？？',\n",
       " '一首歌多数人的故事',\n",
       " '一样的詹',\n",
       " '还有王杰',\n",
       " '音乐起，看到你',\n",
       " '在这找男人怕不是骗人的大家当心',\n",
       " '再过俩天，生辰快乐！[蛋糕]我。隔天，圣诞节[圣诞]。嘻嘻',\n",
       " '你在桥上看风景，看风景的人在楼上看你。明月装饰了你的窗子，你却装饰了别人的梦。',\n",
       " '哈哈哈哈',\n",
       " '19岁\\r\\r\\n发现好歌永远是好歌',\n",
       " '到了现在都变成随口一说了',\n",
       " '以前的歌听起来是一种享受',\n",
       " '二十岁听这歌 发现有别样的感觉',\n",
       " '同城诶',\n",
       " '不知道第几次因为一部小说来听这首歌了，推荐去看我亲爱的骆先生，虐哭的一个小说。每次看到纪贯新为梁子衿唱这首歌的时候，都虐到哭，强烈推荐，很应景',\n",
       " '想找一个偏偏黑否我的人[大哭]',\n",
       " '我活的越来越不像自己了，像你老婆',\n",
       " '为什么我偏偏喜欢你[猪]',\n",
       " '极致3D环绕、双声道歌曲已更新至《越来越不懂》《可不可以》、《盗将行》等……欢迎前来试听自备耳机呀',\n",
       " '爱已是负累，相爱似受罪![多多捂脸]',\n",
       " '封面乍一看挺像van样',\n",
       " '哈哈哈哈哈哈，可爱',\n",
       " '广州华南植物园',\n",
       " '偏偏痴心想见你',\n",
       " '失恋的那天晚上在酒吧喝多了，打车回家途中听到司机放这首歌。我忍不住感叹，唉师傅，我一喝酒就管不住自己下半身。师傅以一个过来人口气说没什么，男人嘛，花天酒地正常。我说师傅，对不起，我尿你车上了[惊恐]',\n",
       " '算了，孤单一辈子也好，我爱的人不敢再爱我，相欠的用时间慢慢还吧',\n",
       " '现在的社会这么浮躁 又哪有什么真心喜欢之人 还不是见一个追一个 追不上就换一个追',\n",
       " '[多多大笑]',\n",
       " '1.52处，历尽沧桑',\n",
       " '我又为何偏偏喜欢你',\n",
       " '好口味，小伙子',\n",
       " '快两点了 网易太坏了',\n",
       " '听过磁带么？',\n",
       " '丹尼离开得太早',\n",
       " '@沈自横--',\n",
       " '听每首歌的背后都藏着一个故事，记得那年我不小心受伤缝了六针，我哭了，刚好晚上有个聚会，很多人都来关心我，把好吃的都先给我，后面又去唱歌，他就唱这首歌给我',\n",
       " '这特么才是古风',\n",
       " '祝您幸福',\n",
       " '没看出我是反问吗？',\n",
       " '当你想说一份感情无意义的时候 还请三思 一思何为意义 二思何为感情 三思何为有意义的感情',\n",
       " '偏偏我喜欢上你',\n",
       " '当你爱上他的时候 这份感情就已经没有任何意义了……',\n",
       " '没关系[憨笑]',\n",
       " '经典就是经典，百听不厌',\n",
       " '多年以后的今天，我才知道，原来是   偏偏喜欢你',\n",
       " '今天日推 忽然就觉得很动人',\n",
       " '你真幸福',\n",
       " '《那些回不去的年少时光》？',\n",
       " '看《那些回不去的年少时光》张骏给罗琦琦放的这首歌，我现在一听就很伤感。',\n",
       " '老歌时间',\n",
       " '来了老弟',\n",
       " '划重点吧',\n",
       " '那个女生叫什么我不知道。而你我甚至记不清姓什么了。我把你们都写在了笔记了。却把笔记丢了。我只记得你们的样子。记得你为了一个女生在全校师生面前唱这首歌。记得你排行十一。如果真的能穿越。我不想改变什么。我只是想记清所有的人和事。还有。。。。不重要了错过就是错过了。可为什么想哭。',\n",
       " '一生中可以喜欢很多人，但心疼的只有你一人  沐',\n",
       " '天妒英才',\n",
       " '我已循环播放多次了',\n",
       " '说爱太沉重 喜欢太浅薄',\n",
       " '是的，你说的没错',\n",
       " '真是百听不厌的一首歌。越听越爽。换个音响或耳机听开来还有区别。这歌是测试人声的好曲。比惠威的不标准粤语的好多了',\n",
       " '把它埋在心底吧，好好努力，面对生活，毕竟谁都年轻过',\n",
       " '告诉我这个点不止我一个人还在刷着网易的评论',\n",
       " '相爱似受罪后面的星号什么意思呢',\n",
       " '哈哈哈',\n",
       " '说得对341364283',\n",
       " nan,\n",
       " '走不出来了',\n",
       " '学到了[大哭]',\n",
       " '就是[亲亲]',\n",
       " '傻孩子，再过几年回顾一下当时的心情，只是一种经历而已',\n",
       " '这首歌。听起来，有感觉，我还是偏偏喜欢你?',\n",
       " '最近老歌一直偏爱我吖~',\n",
       " '能想象的到，美好的画面',\n",
       " '黑凤梨',\n",
       " '我叫陈自强?',\n",
       " '偏偏喜欢你',\n",
       " '李瑞，我爱你！或许有一天你能够看到，也许永远看不到。不过没关系，虽然你走了，但是我还是很想你。我想要你知道，一个男孩深深爱过你！',\n",
       " '现在的人啊！都是什么三观啊！流行就叫潮！我感觉那叫跟风，潮是要讲个性的！喜欢老歌也是一种个性呀！居然说我们不潮！',\n",
       " '偏偏黑凤梨',\n",
       " '说的很对，连反驳的力气都不愿意浪费\\r\\r\\n',\n",
       " '35年前的歌',\n",
       " '对啊听自己喜欢的就好了 管它潮不潮 我室友也这样 说我怎么这么out听这些歌',\n",
       " '只有我是来试耳机的吗',\n",
       " '喜欢一首歌可能因为旋律，或者歌星，又或是某一句歌词打动了自己。而喜欢一个人，不需要理由，就是喜欢。',\n",
       " '你迷人的微笑是你最致命的武器。[亲亲]',\n",
       " '我是真的很喜欢那个跟我没有未来的你！',\n",
       " '偏偏忘不掉你呢',\n",
       " '小时候听过爸爸妈妈放的歌',\n",
       " '意境醉人',\n",
       " '我小时候，我爹妈最喜欢歌的之一，虽然那个时候还不知道有普通话和粤语这样的存在，但是偏偏觉得这样的语调很迷人，果然过了二十多年之后，这样的歌成了最让人安心的存在[多多可怜]',\n",
       " '遇到可爱的人\\r\\r\\n生活一下子不艰难了\\r\\r\\n街道也好 晚风也罢\\r\\r\\n都很甜',\n",
       " '看着书，心底里眼里全是你。',\n",
       " '善良痴情的女孩子的听歌排行过来的[爱心]',\n",
       " '真正的好作品是经得起时间的磨砺的',\n",
       " '喜欢就去追啊[星星]',\n",
       " '听到这首歌就想念我的阿姨，小时候到外婆家就听她用飞利浦唱机放这首歌。祝福她们一家在国外生活幸福快乐',\n",
       " '君生我未生，我生君已老。恨不生同时，日日与君好。',\n",
       " '老了老了，终于审美成熟，从前觉得老，现在很喜欢，可能因为处在幸福的感情之中吧。',\n",
       " '我没有在等你 我只想说今天是喜欢你的第2936天',\n",
       " '好歌经典永留存。。。。',\n",
       " '是人又不是糖干嘛那么甜',\n",
       " '偏偏喜欢的人，没有在一起遗憾一生。',\n",
       " '罗琦琦',\n",
       " '12月17半夜12点46分，你让我删了你。我很平静看着一切，然后你屏蔽了我！我发了一个好，随后又撤回了！但最终还是舍不得下不了手去删掉！',\n",
       " '总会遇见\\r\\r\\n',\n",
       " '最近接触了几个人发现他们都说我不甜说我不识趣，可我就是个不会说撩人的话，撒娇都觉得难为情的人，我只是想把这些话留给那个我能说出口的人。',\n",
       " '以前的社会，女人给心不给身，如今的社会，女人给身不给心。',\n",
       " '八岁的儿子也喜欢上粤语歌了，于是打开了自己尘封的记忆，第一次听Danny的歌也差不多这么大。一周的时间，听了你所有的歌，多么幸运，和你所在的年代还有所交集。多么遗憾，等我长大却再也没有机会去听你的现场……',\n",
       " '我却为何偏偏喜欢你？',\n",
       " '黄家驹我觉得不是意外',\n",
       " '明明我才22岁，为何感觉我已度过大半生，经历多次爱恨情伤。',\n",
       " '教室的音响坏了，修理师傅修完后用这首歌试音\\r\\r\\n刚睡完午觉睡眼惺忪，听着这首歌是多么的惬意\\r\\r\\n这应该是整个高三最值得回忆的几分钟\\r\\r\\n除此之外，高三没给我留下任何回忆',\n",
       " '93去了陈黄03走了张梅',\n",
       " '他是何超琼的挚爱吧？好可惜没在一起',\n",
       " '常',\n",
       " '爱',\n",
       " '我',\n",
       " '谢谢，一定会更努力的',\n",
       " '真的我现在就是这个状态',\n",
       " '“一直觉得如果有机会我会是个合格的恋人，温柔 大方 善解人意之类的',\n",
       " nan,\n",
       " '只希望以后你一直要好好的，一个人在外面读书要照顾好自己。夏青，你要记住，在你生命中有过一个爱你的肖先生。希望太原师范学院的同学们能让她看到。',\n",
       " '平日里我不说 但我明白 上帝是故意让我在59分上的\\r\\r\\n他们的处境我理解 都跟我一样 天妒英才',\n",
       " '2016年10月我知道了你，2017年1月1日我认识了你，2017年1月28日我向你表白，我们在一起了。一年的时间过的很快，或许是因为第一次这么认真的喜欢一个人，慢慢的就不像当初那么热情，终于，在2018年2月13日的凌晨，我失去了你。人这一生，很多事情总要在失去后才会后悔，才懂得去珍惜。',\n",
       " '爱以是负累相爱似受罪，我又为何偏偏喜欢你',\n",
       " '我又为何偏偏喜欢你',\n",
       " '因为看了《那些回不去的年少时光》而来听的\\r\\r\\n说实话这种调调的歌真的是满满的年代感',\n",
       " 'ht，别在被渣男骗了，眼睛擦亮点，虽然我一直骂你蠢，但是还是会有一点心疼?',\n",
       " '你听用这首歌发了一个喜欢我的动态，瞬间泪崩',\n",
       " '昨天我翻到快手了',\n",
       " '说爱太重了，我俩真的就是用喜欢比较适合，而我却以爱的标准来要求你，我俩的喜欢可能永远成为遗憾，但我记得我偏偏喜欢你',\n",
       " '我也是因为张骏才来听得[流泪][流泪]',\n",
       " '我又為何偏偏喜歡你啊??',\n",
       " '试音大队呢？',\n",
       " '这是一首经典并且比00后年龄要大的歌曲，但是这也阻挡不了我一个00后对经典的热爱，每当我放起这类歌曲时，身边的同学总爱说你的口味落伍了之类的话，我只想说你们不理解这中间的感觉，经典是要用时间来读懂和感受的，漫漫人生，细细品味。[呲牙][大笑]',\n",
       " '仅仅如此',\n",
       " '网易云私人FM   最近啥情况不是70-80后歌曲，就是金典电视剧插曲比如（射雕英雄转，天龙八部，春光灿烂猪八戒，等等。。。。），可是我是90后，什么原因大家应该都懂得！[大哭]',\n",
       " '还记得高中的时候，我是学校的文艺支持，我在4000多人的舞台上唱了这首歌，她在台下默默的流泪，因为只有她能懂这首歌是为她唱的！可惜最后没能走到一起！  粤语歌曲给了我们青春，致爱！ 28岁路过',\n",
       " '[多多大哭]',\n",
       " '我跟你的相反，喜欢更容易说出口',\n",
       " '他应该62岁了吧',\n",
       " '人说： 女人错过了那个她最想嫁的人 就会变得挑剔。 男人错过那个他最想娶的人， 就会变的很随意。',\n",
       " '说来也神奇啊',\n",
       " '“我喜欢你”比“爱你”更加难说出来…',\n",
       " '其实我不想让你把我归类到好朋友的位置上，在你心里可曾喜欢过我。两年了，我从未敢讲出喜欢你',\n",
       " '其实我们是一类人，当年我明明get到了我们之间的心意，可我错过了，忘了多长时间了，希望你原谅我的年少无知，记得你被别人伤的那么深，我却没有资格为你讨回公道。你的感情里我没资格插手…咳咳。希望你以后能幸福，这样我才能真正睡觉。',\n",
       " '兄弟我也是？',\n",
       " '然后你就是他们爱后的结晶，哈哈。',\n",
       " '我真的猴心疼纪贯新quq！！！',\n",
       " 'van漾是你吗？',\n",
       " '青山又送晚霞归，可我却迟迟等不到你！！！',\n",
       " '啊，刚看到，这歌比你年纪大了吧',\n",
       " '同城哦',\n",
       " '照片上还有王杰，',\n",
       " '偏偏喜欢你\\r\\r\\n最终还是说出了口\\r\\r\\n现在，\\r\\r\\n担心你我像相交线\\r\\r\\n越走越近\\r\\r\\n相遇过后\\r\\r\\n越走越远',\n",
       " '一直寻找的歌?私人FM帮我找回了小时候的记忆',\n",
       " '04喜欢哥哥加一',\n",
       " '不论什么语言在汉语面前都是可以空耳的哈[大笑]',\n",
       " '老爸车上的单曲循环，然后我就会唱了[呆][呆]',\n",
       " '不会粤语也可以唱粤语歌 亲测',\n",
       " '那也得有品味的欣赏者啊 就如同你我 ',\n",
       " '57岁了没有他自己的家庭？？？？',\n",
       " '喜欢就是喜欢，偏偏喜欢你',\n",
       " '多听多讲就会',\n",
       " '想学粤语歌，但是不会粤语',\n",
       " '可以',\n",
       " '我爱你，我说我爱你，溢于言表。\\r\\r\\n我喜欢你，我说我喜欢你，昭然可见。 ??',\n",
       " '因为怀旧很喜欢老歌，作为04的我想着 哥哥和Dnny',\n",
       " '偏偏喜欢你......',\n",
       " '喜欢啊',\n",
       " '以前很怕死 现在不怕了 想想那边有那么多伟大的人 我还害怕什么 挺好的[大哭][大哭]',\n",
       " '自从你说你喜欢老歌和粤语歌以后 我的歌单里和日推全是关于你',\n",
       " '喜欢老歌',\n",
       " '好好听的歌声',\n",
       " '还是老歌好听',\n",
       " '只有我觉得danny的歌 比张国荣的好听吗[惊恐]',\n",
       " ...]"
      ]
     },
     "execution_count": 54,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "documents"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "k = pd.read_csv(r\"k.csv\",encoding='gbk', sep=',', header=0,index_col=0)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style>\n",
       "    .dataframe thead tr:only-child th {\n",
       "        text-align: right;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: left;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>title_cutted</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>328901978</th>\n",
       "      <td>都 是 有 故事 的 人</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1724358802</th>\n",
       "      <td>每天 都 要 听 至爱 Danny</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>451250610</th>\n",
       "      <td>对 呀 ， 你 就 从来 没 喜欢 过 我 。 一点 都 煤油</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>554348857</th>\n",
       "      <td>沁入 心脾 的 温柔</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1296389446</th>\n",
       "      <td>最近 好 喜欢 这 首歌</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                               title_cutted\n",
       "328901978                      都 是 有 故事 的 人\n",
       "1724358802                每天 都 要 听 至爱 Danny\n",
       "451250610   对 呀 ， 你 就 从来 没 喜欢 过 我 。 一点 都 煤油\n",
       "554348857                        沁入 心脾 的 温柔\n",
       "1296389446                     最近 好 喜欢 这 首歌"
      ]
     },
     "execution_count": 17,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "k.head()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 20,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['都', ' ', '是', ' ', '有', ' ', '故', '事', ' ', '的', ' ', '人']"
      ]
     },
     "execution_count": 20,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "list(k['title_cutted'].iloc[0])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 23,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "mytest = [i for i in list(k['title_cutted'].iloc[0]) if i != ' ']"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['都', '是', '有', '故', '事', '的', '人']"
      ]
     },
     "execution_count": 24,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "mytest"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 34,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "def frame_to_list(mytext):\n",
    "    return [i for i in list(mytext) if i != ' ']"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 35,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "f=[]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "for j in range(0:10):\n",
    "    k['title_cutted'].iloc[j][i for i in list(k['title_cutted'].iloc[j]) if i != ' ']"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 36,
   "metadata": {},
   "outputs": [],
   "source": [
    "f = k.apply(frame_to_list)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 37,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style>\n",
       "    .dataframe thead tr:only-child th {\n",
       "        text-align: right;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: left;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>title_cutted</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>328901978</th>\n",
       "      <td>都 是 有 故事 的 人</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1724358802</th>\n",
       "      <td>每天 都 要 听 至爱 Danny</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>451250610</th>\n",
       "      <td>对 呀 ， 你 就 从来 没 喜欢 过 我 。 一点 都 煤油</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>554348857</th>\n",
       "      <td>沁入 心脾 的 温柔</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1296389446</th>\n",
       "      <td>最近 好 喜欢 这 首歌</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>303721726</th>\n",
       "      <td>今日 点歌 ③ .</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1654009353</th>\n",
       "      <td>偏偏 对 你 没有 抵抗力</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1654009353</th>\n",
       "      <td>那 一次 我们 擦肩而过 ， 我 害怕 我们 会 像 电影 里 的 情景 一样 错过 ， 所...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>357343565</th>\n",
       "      <td>“ 我 喜欢 你 ” 珍贵 ， 奈何 听 的 人 不 珍惜 … …</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>293896875</th>\n",
       "      <td>偏偏 喜欢 你     王雷雷</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1510414811</th>\n",
       "      <td>对 啊 ， 这是 为什么 呢 。</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1574359988</th>\n",
       "      <td>对 ， 好 浪漫</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1333924430</th>\n",
       "      <td>小时候 有个 小 的 收音机 ， 好开心 ， 睡觉 都 舍不得 放下</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>64188725</th>\n",
       "      <td>好听</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>482121141</th>\n",
       "      <td>这些 歌曲 都 是 经典作品 [ 亲亲 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>427963594</th>\n",
       "      <td>偏偏 喜欢 你 ， 我 的 翩翩 夫人 。</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1382017788</th>\n",
       "      <td>以 爱情     以 时光 \\r\\r\\n \\r\\r\\n 纪贯 新 ~ ?</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>46656982</th>\n",
       "      <td>我 和 他 来 一家 店 吃饭 ， 店里 在 放 这 首歌 ， 他 问 我 ， 你 知道 这...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>425557078</th>\n",
       "      <td>幸福 到 疼 … …</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>有一个人曾让我知道</th>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>寄生于世原来是那么的好</th>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>568096298</th>\n",
       "      <td>超级 喜欢 的 一首歌 ， 偏偏 喜欢 你 【 大赞 】 [ 爱心 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>412381224</th>\n",
       "      <td>他 可能 会 单手 开 法拉利</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>301593622</th>\n",
       "      <td>[ 多多 大笑 ] [ 多多 大笑 ] [ 多多 大笑 ] 笑 着 活下去</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1455906926</th>\n",
       "      <td>再见 吧 大渣 男</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1670031755</th>\n",
       "      <td>[ 憨笑 ] 我 比 你 还俗   更穷</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>301593622</th>\n",
       "      <td>现在 一心 只想 搞钱 ， 我 比较 俗 ， 太穷 了 ！</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1730181168</th>\n",
       "      <td>哈哈哈哈 这个 年代 感 哦</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>279684331</th>\n",
       "      <td>偏偏 喜欢 的 就是 得不到 ！</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>621542625</th>\n",
       "      <td>阿 Lan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>62338668</th>\n",
       "      <td>nice</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>62338668</th>\n",
       "      <td>愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>68320201</th>\n",
       "      <td>忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>246752393</th>\n",
       "      <td>張國榮</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>134205876</th>\n",
       "      <td>还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>122104993</th>\n",
       "      <td>班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>100442347</th>\n",
       "      <td>中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>118207115</th>\n",
       "      <td>别咒 王杰</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>116595775</th>\n",
       "      <td>我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>60109810</th>\n",
       "      <td>2000 年生 却 偏偏 喜欢 80 年代</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>63357164</th>\n",
       "      <td>情爱   是 什么   只有 呵呵 [ 大哭 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>62338668</th>\n",
       "      <td>[ 可爱 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>95087236</th>\n",
       "      <td>对 啊 ， 为何 偏偏 喜欢 你</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>68320201</th>\n",
       "      <td>[ 大笑 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>79282042</th>\n",
       "      <td>[ 皱眉 ] [ 皱眉 ] [ 皱眉 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>83512955</th>\n",
       "      <td>听过 这 首歌 的 人 都 是 有 故事 的 男人 和 女人 [ 跳舞 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>67061365</th>\n",
       "      <td>上班 特别 累 的 时候 听到 香港 的 经典 感觉 整个 世界 都 属于 我 ， 要是 来...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>71401843</th>\n",
       "      <td>当年 的 录像厅 前面 就 放 的 这 首歌</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>103882075</th>\n",
       "      <td>他 还 没 死 [ 大哭 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>62338668</th>\n",
       "      <td>我 01 的</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>62338668</th>\n",
       "      <td>nice</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>62338668</th>\n",
       "      <td>愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>68320201</th>\n",
       "      <td>忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>246752393</th>\n",
       "      <td>張國榮</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>134205876</th>\n",
       "      <td>还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>122104993</th>\n",
       "      <td>班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>100442347</th>\n",
       "      <td>中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>118207115</th>\n",
       "      <td>别咒 王杰</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>116595775</th>\n",
       "      <td>我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>60109810</th>\n",
       "      <td>2000 年生 却 偏偏 喜欢 80 年代</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>20523 rows × 1 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "                                                  title_cutted\n",
       "328901978                                         都 是 有 故事 的 人\n",
       "1724358802                                   每天 都 要 听 至爱 Danny\n",
       "451250610                      对 呀 ， 你 就 从来 没 喜欢 过 我 。 一点 都 煤油\n",
       "554348857                                           沁入 心脾 的 温柔\n",
       "1296389446                                        最近 好 喜欢 这 首歌\n",
       "303721726                                            今日 点歌 ③ .\n",
       "1654009353                                       偏偏 对 你 没有 抵抗力\n",
       "1654009353   那 一次 我们 擦肩而过 ， 我 害怕 我们 会 像 电影 里 的 情景 一样 错过 ， 所...\n",
       "357343565                    “ 我 喜欢 你 ” 珍贵 ， 奈何 听 的 人 不 珍惜 … …\n",
       "293896875                                      偏偏 喜欢 你     王雷雷\n",
       "1510414811                                    对 啊 ， 这是 为什么 呢 。\n",
       "1574359988                                            对 ， 好 浪漫\n",
       "1333924430                  小时候 有个 小 的 收音机 ， 好开心 ， 睡觉 都 舍不得 放下\n",
       "64188725                                                    好听\n",
       "482121141                                这些 歌曲 都 是 经典作品 [ 亲亲 ]\n",
       "427963594                                偏偏 喜欢 你 ， 我 的 翩翩 夫人 。\n",
       "1382017788                以 爱情     以 时光 \\r\\r\\n \\r\\r\\n 纪贯 新 ~ ?\n",
       "46656982     我 和 他 来 一家 店 吃饭 ， 店里 在 放 这 首歌 ， 他 问 我 ， 你 知道 这...\n",
       "425557078                                           幸福 到 疼 … …\n",
       "有一个人曾让我知道                                                  NaN\n",
       "寄生于世原来是那么的好                                                NaN\n",
       "568096298                  超级 喜欢 的 一首歌 ， 偏偏 喜欢 你 【 大赞 】 [ 爱心 ]\n",
       "412381224                                      他 可能 会 单手 开 法拉利\n",
       "301593622                [ 多多 大笑 ] [ 多多 大笑 ] [ 多多 大笑 ] 笑 着 活下去\n",
       "1455906926                                           再见 吧 大渣 男\n",
       "1670031755                                [ 憨笑 ] 我 比 你 还俗   更穷\n",
       "301593622                        现在 一心 只想 搞钱 ， 我 比较 俗 ， 太穷 了 ！\n",
       "1730181168                                      哈哈哈哈 这个 年代 感 哦\n",
       "279684331                                     偏偏 喜欢 的 就是 得不到 ！\n",
       "621542625                                                阿 Lan\n",
       "...                                                        ...\n",
       "62338668                                                  nice\n",
       "62338668     愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...\n",
       "68320201     忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...\n",
       "246752393                                                  張國榮\n",
       "134205876    还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...\n",
       "122104993    班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...\n",
       "100442347    中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...\n",
       "118207115                                                别咒 王杰\n",
       "116595775    我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]\n",
       "60109810                                 2000 年生 却 偏偏 喜欢 80 年代\n",
       "63357164                              情爱   是 什么   只有 呵呵 [ 大哭 ]\n",
       "62338668                                                [ 可爱 ]\n",
       "95087236                                      对 啊 ， 为何 偏偏 喜欢 你\n",
       "68320201                                                [ 大笑 ]\n",
       "79282042                                  [ 皱眉 ] [ 皱眉 ] [ 皱眉 ]\n",
       "83512955                 听过 这 首歌 的 人 都 是 有 故事 的 男人 和 女人 [ 跳舞 ]\n",
       "67061365     上班 特别 累 的 时候 听到 香港 的 经典 感觉 整个 世界 都 属于 我 ， 要是 来...\n",
       "71401843                                当年 的 录像厅 前面 就 放 的 这 首歌\n",
       "103882075                                       他 还 没 死 [ 大哭 ]\n",
       "62338668                                                我 01 的\n",
       "62338668                                                  nice\n",
       "62338668     愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...\n",
       "68320201     忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...\n",
       "246752393                                                  張國榮\n",
       "134205876    还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...\n",
       "122104993    班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...\n",
       "100442347    中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...\n",
       "118207115                                                别咒 王杰\n",
       "116595775    我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]\n",
       "60109810                                 2000 年生 却 偏偏 喜欢 80 年代\n",
       "\n",
       "[20523 rows x 1 columns]"
      ]
     },
     "execution_count": 37,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "f"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 18,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "title_cutted    都 是 有 故事 的 人\n",
       "Name: 328901978, dtype: object"
      ]
     },
     "execution_count": 18,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "k.iloc[0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 75,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import numpy as np"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 78,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "False\n"
     ]
    }
   ],
   "source": [
    "print(np.any(k.isnull())== True)  #isnull检测是否含有NaN值，有就返回True。np.any()检测df数据中是否含有等于Ture的值"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 77,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "k=k.fillna(' ')   #NaN值填充："
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 117,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "12"
      ]
     },
     "execution_count": 117,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(k['title_cutted'][0])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 119,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "'都 是 有 故事 的 人'"
      ]
     },
     "execution_count": 119,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "k['title_cutted'][0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 79,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "                                                  title_cutted\n",
      "328901978                                         都 是 有 故事 的 人\n",
      "1724358802                                   每天 都 要 听 至爱 Danny\n",
      "451250610                      对 呀 ， 你 就 从来 没 喜欢 过 我 。 一点 都 煤油\n",
      "554348857                                           沁入 心脾 的 温柔\n",
      "1296389446                                        最近 好 喜欢 这 首歌\n",
      "303721726                                            今日 点歌 ③ .\n",
      "1654009353                                       偏偏 对 你 没有 抵抗力\n",
      "1654009353   那 一次 我们 擦肩而过 ， 我 害怕 我们 会 像 电影 里 的 情景 一样 错过 ， 所...\n",
      "357343565                    “ 我 喜欢 你 ” 珍贵 ， 奈何 听 的 人 不 珍惜 … …\n",
      "293896875                                      偏偏 喜欢 你     王雷雷\n",
      "1510414811                                    对 啊 ， 这是 为什么 呢 。\n",
      "1574359988                                            对 ， 好 浪漫\n",
      "1333924430                  小时候 有个 小 的 收音机 ， 好开心 ， 睡觉 都 舍不得 放下\n",
      "64188725                                                    好听\n",
      "482121141                                这些 歌曲 都 是 经典作品 [ 亲亲 ]\n",
      "427963594                                偏偏 喜欢 你 ， 我 的 翩翩 夫人 。\n",
      "1382017788                以 爱情     以 时光 \\r\\r\\n \\r\\r\\n 纪贯 新 ~ ?\n",
      "46656982     我 和 他 来 一家 店 吃饭 ， 店里 在 放 这 首歌 ， 他 问 我 ， 你 知道 这...\n",
      "425557078                                           幸福 到 疼 … …\n",
      "有一个人曾让我知道                                                     \n",
      "寄生于世原来是那么的好                                                   \n",
      "568096298                  超级 喜欢 的 一首歌 ， 偏偏 喜欢 你 【 大赞 】 [ 爱心 ]\n",
      "412381224                                      他 可能 会 单手 开 法拉利\n",
      "301593622                [ 多多 大笑 ] [ 多多 大笑 ] [ 多多 大笑 ] 笑 着 活下去\n",
      "1455906926                                           再见 吧 大渣 男\n",
      "1670031755                                [ 憨笑 ] 我 比 你 还俗   更穷\n",
      "301593622                        现在 一心 只想 搞钱 ， 我 比较 俗 ， 太穷 了 ！\n",
      "1730181168                                      哈哈哈哈 这个 年代 感 哦\n",
      "279684331                                     偏偏 喜欢 的 就是 得不到 ！\n",
      "621542625                                                阿 Lan\n",
      "...                                                        ...\n",
      "62338668                                                  nice\n",
      "62338668     愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...\n",
      "68320201     忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...\n",
      "246752393                                                  張國榮\n",
      "134205876    还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...\n",
      "122104993    班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...\n",
      "100442347    中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...\n",
      "118207115                                                别咒 王杰\n",
      "116595775    我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]\n",
      "60109810                                 2000 年生 却 偏偏 喜欢 80 年代\n",
      "63357164                              情爱   是 什么   只有 呵呵 [ 大哭 ]\n",
      "62338668                                                [ 可爱 ]\n",
      "95087236                                      对 啊 ， 为何 偏偏 喜欢 你\n",
      "68320201                                                [ 大笑 ]\n",
      "79282042                                  [ 皱眉 ] [ 皱眉 ] [ 皱眉 ]\n",
      "83512955                 听过 这 首歌 的 人 都 是 有 故事 的 男人 和 女人 [ 跳舞 ]\n",
      "67061365     上班 特别 累 的 时候 听到 香港 的 经典 感觉 整个 世界 都 属于 我 ， 要是 来...\n",
      "71401843                                当年 的 录像厅 前面 就 放 的 这 首歌\n",
      "103882075                                       他 还 没 死 [ 大哭 ]\n",
      "62338668                                                我 01 的\n",
      "62338668                                                  nice\n",
      "62338668     愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...\n",
      "68320201     忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...\n",
      "246752393                                                  張國榮\n",
      "134205876    还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...\n",
      "122104993    班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...\n",
      "100442347    中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...\n",
      "118207115                                                别咒 王杰\n",
      "116595775    我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]\n",
      "60109810                                 2000 年生 却 偏偏 喜欢 80 年代\n",
      "\n",
      "[20523 rows x 1 columns]\n"
     ]
    }
   ],
   "source": [
    "print(k)  "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 89,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "a=[1]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 90,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "b=[2]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 91,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "c = [3] "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 92,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "d = [] "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 93,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "#d = [[a, b, c, d]]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 94,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "d = [l for l in [a, b, c, d] if len(l) > 0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "for i"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 57,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "nan"
      ]
     },
     "execution_count": 57,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "k['title_cutted'].iloc[19]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "def chinese_word_cut(mytext):\n",
    "    return \" \".join(jieba.cut(mytext))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 107,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "a=[i for i in list(k['title_cutted'].iloc[0]) if i != ' ']"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 108,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "b=[i for i in list(k['title_cutted'].iloc[1]) if i != ' ']"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 109,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "m=[]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 110,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "m=[l for l in [a,b,m] if len(l) > 0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 104,
   "metadata": {},
   "outputs": [],
   "source": [
    "for j in range(0,20523):\n",
    "    a=[i for i in list(k['title_cutted'].iloc[j]) if i != ' ']\n",
    "    m=[l for l in [a, m] if len(l) > 0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 112,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "2"
      ]
     },
     "execution_count": 112,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(m)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 114,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[['都', '是', '有', '故', '事', '的', '人'],\n",
       " ['每', '天', '都', '要', '听', '至', '爱', 'D', 'a', 'n', 'n', 'y']]"
      ]
     },
     "execution_count": 114,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "m"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "m=[l for l in [[i for i in list(k['title_cutted'].iloc[0]) if i != ' '], m] if len(l) > 0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 95,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "[[1], [2], [3]]\n"
     ]
    }
   ],
   "source": [
    "print(d)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "m=[i for i in list(k['title_cutted'].iloc[0]) if i != ' ']"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "d = [l for l in [a, b, c, d] if len(l) > 0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 55,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "# -*- coding: utf-8 -*-\n",
    "from gensim import corpora, models, similarities\n",
    "import logging\n",
    "from collections import defaultdict\n",
    "logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 56,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "# 文档\n",
    "#documents = [\"Human machine interface for lab abc computer applications\",\n",
    "#             \"A survey of user opinion of computer system response time\",\n",
    "#             \"The EPS user interface management system\",\n",
    "#             \"System and human system engineering testing of EPS\",\n",
    "#             \"Relation of user perceived response time to error measurement\",\n",
    "#             \"The generation of random binary unordered trees\",\n",
    "#             \"The intersection graph of paths in trees\",\n",
    "#             \"Graph minors IV Widths of trees and well quasi ordering\",\n",
    "#             \"Graph minors A survey\"]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 57,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "#type(documents)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 96,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "documents = [\"Human machine interface for lab abc computer applications\",\n",
    "             \"A survey of user opinion of computer system response time\",\n",
    "             \"The EPS user interface management system\",\n",
    "             \"System and human system engineering testing of EPS\",\n",
    "             \"Relation of user perceived response time to error measurement\",\n",
    "             \"The generation of random binary unordered trees\",\n",
    "             \"The intersection graph of paths in trees\",\n",
    "             \"Graph minors IV Widths of trees and well quasi ordering\",\n",
    "             \"Graph minors A survey\"]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 97,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------1----------\n",
      "[['human', 'machine', 'interface', 'lab', 'abc', 'computer', 'applications'], ['survey', 'user', 'opinion', 'computer', 'system', 'response', 'time'], ['eps', 'user', 'interface', 'management', 'system'], ['system', 'human', 'system', 'engineering', 'testing', 'eps'], ['relation', 'user', 'perceived', 'response', 'time', 'error', 'measurement'], ['generation', 'random', 'binary', 'unordered', 'trees'], ['intersection', 'graph', 'paths', 'trees'], ['graph', 'minors', 'iv', 'widths', 'trees', 'well', 'quasi', 'ordering'], ['graph', 'minors', 'survey']]\n",
      "<class 'list'>\n"
     ]
    }
   ],
   "source": [
    "# 1.分词，去除停用词\n",
    "stoplist = set('for a of the and to in'.split())\n",
    "texts = [[word for word in document.lower().split() if word not in stoplist] for document in documents]\n",
    "print('-----------1----------')\n",
    "print(texts)\n",
    "print(type(texts))\n",
    "# [['human', 'machine', 'interface', 'lab', 'abc', 'computer', 'applications'], ['survey', 'user', 'opinion', 'computer', 'system', 'response', 'time'],\n",
    "# ['eps', 'user', 'interface', 'management', 'system'], ['system', 'human', 'system', 'engineering', 'testing', 'eps'], ['relation', 'user', 'perceived\n",
    "# ', 'response', 'time', 'error', 'measurement'], ['generation', 'random', 'binary', 'unordered', 'trees'], ['intersection', 'graph', 'paths', 'trees'],\n",
    "# ['graph', 'minors', 'iv', 'widths', 'trees', 'well', 'quasi', 'ordering'], ['graph', 'minors', 'survey']]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 98,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "9"
      ]
     },
     "execution_count": 98,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(texts)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------2----------\n",
      "[['human', 'interface', 'computer'], ['survey', 'user', 'computer', 'system', 'response', 'time'], ['eps', 'user', 'interface', 'system'], ['system', 'human', 'system', 'eps'], ['user', 'response', 'time'], ['trees'], ['graph', 'trees'], ['graph', 'minors', 'trees'], ['graph', 'minors', 'survey']]\n"
     ]
    }
   ],
   "source": [
    "# 2.计算词频\n",
    "frequency = defaultdict(int)  # 构建一个字典对象\n",
    "# 遍历分词后的结果集，计算每个词出现的频率\n",
    "for text in texts:\n",
    "    for token in text:\n",
    "        frequency[token] += 1\n",
    "# 选择频率大于1的词\n",
    "texts = [[token for token in text if frequency[token] > 1] for text in texts]\n",
    "print('-----------2----------')\n",
    "print(texts)\n",
    "# [['human', 'interface', 'computer'], ['survey', 'user', 'computer', 'system', 'response', 'time'], ['eps', 'user', 'interface', 'system'], ['system',\n",
    "# 'human', 'system', 'eps'], ['user', 'response', 'time'], ['trees'], ['graph', 'trees'], ['graph', 'minors', 'trees'], ['graph', 'minors', 'survey']]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "2019-01-17 01:12:49,444 : INFO : adding document #0 to Dictionary(0 unique tokens: [])\n",
      "2019-01-17 01:12:49,451 : INFO : built Dictionary(12 unique tokens: ['computer', 'human', 'interface', 'response', 'survey']...) from 9 documents (total 29 corpus positions)\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------3----------\n",
      "{'computer': 0, 'human': 1, 'interface': 2, 'response': 3, 'survey': 4, 'system': 5, 'time': 6, 'user': 7, 'eps': 8, 'trees': 9, 'graph': 10, 'minors': 11}\n"
     ]
    }
   ],
   "source": [
    "# 3.创建字典（单词与编号之间的映射）\n",
    "dictionary = corpora.Dictionary(texts)\n",
    "# print(dictionary)\n",
    "# Dictionary(12 unique tokens: ['time', 'computer', 'graph', 'minors', 'trees']...)\n",
    "# 打印字典，key为单词，value为单词的编号\n",
    "print('-----------3----------')\n",
    "print(dictionary.token2id)\n",
    "# {'human': 0, 'interface': 1, 'computer': 2, 'survey': 3, 'user': 4, 'system': 5, 'response': 6, 'time': 7, 'eps': 8, 'trees': 9, 'graph': 10, 'minors': 11}"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------4----------\n",
      "[[(0, 1), (1, 1)], [(0, 1), (3, 1), (4, 1), (5, 1), (6, 1), (7, 1)]]\n"
     ]
    }
   ],
   "source": [
    "# 4.将要比较的文档转换为向量（词袋表示方法）\n",
    "# 要比较的文档\n",
    "test_doc = [\"Human computer interaction\",'A survey of user opinion of computer system response time']\n",
    "# 将文档分词并使用doc2bow方法对每个不同单词的词频进行了统计，并将单词转换为其编号，然后以稀疏向量的形式返回结果\n",
    "new_vecs = [dictionary.doc2bow(doc.lower().split()) for doc in test_doc]\n",
    "print('-----------4----------')\n",
    "print(new_vecs)\n",
    "# [[(0, 1), (2, 1)]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------5----------\n",
      "[[(0, 1), (1, 1), (2, 1)], [(0, 1), (3, 1), (4, 1), (5, 1), (6, 1), (7, 1)], [(2, 1), (5, 1), (7, 1), (8, 1)], [(1, 1), (5, 2), (8, 1)], [(3, 1), (6, 1), (7, 1)], [(9, 1)], [(9, 1), (10, 1)], [(9, 1), (10, 1), (11, 1)], [(4, 1), (10, 1), (11, 1)]]\n"
     ]
    }
   ],
   "source": [
    "# 5.建立语料库\n",
    "# 将每一篇文档转换为向量\n",
    "corpus = [dictionary.doc2bow(text) for text in texts]\n",
    "print('-----------5----------')\n",
    "print(corpus)\n",
    "# [[[(0, 1), (1, 1), (2, 1)], [(2, 1), (3, 1), (4, 1), (5, 1), (6, 1), (7, 1)], [(1, 1), (4, 1), (5, 1), (8, 1)], [(0, 1), (5, 2), (8, 1)], [(4, 1), (6, 1), (7, 1)], [(9, 1)], [(9, 1), (10, 1)], [(9, 1), (10, 1), (11, 1)], [(3, 1), (10, 1), (11, 1)]]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "2019-01-17 01:12:56,093 : INFO : collecting document frequencies\n",
      "2019-01-17 01:12:56,096 : INFO : PROGRESS: processing document #0\n",
      "2019-01-17 01:12:56,113 : INFO : calculating IDF weights for 9 documents and 11 features (28 matrix non-zeros)\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------6----------\n",
      "[(0, 0.70710678118654757), (1, 0.70710678118654757)]\n"
     ]
    }
   ],
   "source": [
    "# 6.初始化模型\n",
    "# 初始化一个tfidf模型,可以用它来转换向量（词袋整数计数）表示方法为新的表示方法（Tfidf 实数权重）\n",
    "tfidf = models.TfidfModel(corpus)\n",
    "# 测试\n",
    "test_doc_bow = [(0, 1), (1, 1)]\n",
    "print('-----------6----------')\n",
    "print(tfidf[test_doc_bow])\n",
    "# [(0, 0.7071067811865476), (1, 0.7071067811865476)]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------7----------\n",
      "[(0, 0.57735026918962573), (1, 0.57735026918962573), (2, 0.57735026918962573)]\n",
      "[(0, 0.44424552527467476), (3, 0.44424552527467476), (4, 0.44424552527467476), (5, 0.32448702061385548), (6, 0.44424552527467476), (7, 0.32448702061385548)]\n",
      "[(2, 0.5710059809418182), (5, 0.41707573620227772), (7, 0.41707573620227772), (8, 0.5710059809418182)]\n",
      "[(1, 0.49182558987264147), (5, 0.71848116070837686), (8, 0.49182558987264147)]\n",
      "[(3, 0.62825804686700459), (6, 0.62825804686700459), (7, 0.45889394536615247)]\n",
      "[(9, 1.0)]\n",
      "[(9, 0.70710678118654746), (10, 0.70710678118654746)]\n",
      "[(9, 0.50804290089167492), (10, 0.50804290089167492), (11, 0.69554641952003704)]\n",
      "[(4, 0.62825804686700459), (10, 0.45889394536615247), (11, 0.62825804686700459)]\n"
     ]
    }
   ],
   "source": [
    "print('-----------7----------')\n",
    "# 将整个语料库转为tfidf表示方法\n",
    "corpus_tfidf = tfidf[corpus]\n",
    "for doc in corpus_tfidf:\n",
    "    print(doc)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "2019-01-17 01:13:00,595 : WARNING : scanning corpus to determine the number of features (consider setting `num_features` explicitly)\n",
      "2019-01-17 01:13:00,599 : INFO : creating matrix with 9 documents and 12 features\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "-----------8----------\n",
      "-----------9----------\n",
      "[array([ 0.81649655,  0.31412902,  0.        ,  0.34777319,  0.        ,\n",
      "        0.        ,  0.        ,  0.        ,  0.        ], dtype=float32), array([ 0.25648525,  1.        ,  0.27067134,  0.23313783,  0.70710683,\n",
      "        0.        ,  0.        ,  0.        ,  0.27910084], dtype=float32)]\n"
     ]
    }
   ],
   "source": [
    "# 7.创建索引\n",
    "index = similarities.MatrixSimilarity(corpus_tfidf)\n",
    " \n",
    "print('-----------8----------')\n",
    "# 8.相似度计算\n",
    "new_vec_tfidf_ls = [tfidf[new_vec] for new_vec in new_vecs]  # 将要比较文档转换为tfidf表示方法\n",
    " \n",
    "print('-----------9----------')\n",
    "# 计算要比较的文档与语料库中每篇文档的相似度\n",
    "sims = [index[new_vec_tfidf] for new_vec_tfidf in new_vec_tfidf_ls]\n",
    "print(sims)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 34,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "list"
      ]
     },
     "execution_count": 34,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "type(sims)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0.23313783"
      ]
     },
     "execution_count": 22,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "sims[1][3]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 26,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "array([ 0.        ,  0.        ,  0.        ,  0.23313783,  0.25648525,\n",
       "        0.27067134,  0.27910084,  0.70710683,  1.        ], dtype=float32)"
      ]
     },
     "execution_count": 26,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "sims[1]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import numpy as np"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 25,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "array([0, 1, 2, 3, 4, 5, 6, 7, 8], dtype=int64)"
      ]
     },
     "execution_count": 25,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "np.argsort(sims[1])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 32,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[array([ 0.81649655,  0.31412902,  0.        ,  0.34777319,  0.        ,\n",
       "         0.        ,  0.        ,  0.        ,  0.        ], dtype=float32),\n",
       " array([ 0.        ,  0.        ,  0.        ,  0.23313783,  0.25648525,\n",
       "         0.27067134,  0.27910084,  0.70710683,  1.        ], dtype=float32)]"
      ]
     },
     "execution_count": 32,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "list(sims)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 70,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import os\n",
    "os.chdir('G:\\\\项目\\\\网易云音乐评论\\\\文本挖掘')  # 打印当前工作目录"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 71,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 72,
   "metadata": {},
   "outputs": [],
   "source": [
    "k = pd.read_csv(r\"k.csv\",encoding='gbk', sep=',', header=0,index_col=0)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 73,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "(20523, 1)"
      ]
     },
     "execution_count": 73,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "k.shape"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 74,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "<bound method NDFrame.head of                                                   title_cutted\n",
       "328901978                                         都 是 有 故事 的 人\n",
       "1724358802                                   每天 都 要 听 至爱 Danny\n",
       "451250610                      对 呀 ， 你 就 从来 没 喜欢 过 我 。 一点 都 煤油\n",
       "554348857                                           沁入 心脾 的 温柔\n",
       "1296389446                                        最近 好 喜欢 这 首歌\n",
       "303721726                                            今日 点歌 ③ .\n",
       "1654009353                                       偏偏 对 你 没有 抵抗力\n",
       "1654009353   那 一次 我们 擦肩而过 ， 我 害怕 我们 会 像 电影 里 的 情景 一样 错过 ， 所...\n",
       "357343565                    “ 我 喜欢 你 ” 珍贵 ， 奈何 听 的 人 不 珍惜 … …\n",
       "293896875                                      偏偏 喜欢 你     王雷雷\n",
       "1510414811                                    对 啊 ， 这是 为什么 呢 。\n",
       "1574359988                                            对 ， 好 浪漫\n",
       "1333924430                  小时候 有个 小 的 收音机 ， 好开心 ， 睡觉 都 舍不得 放下\n",
       "64188725                                                    好听\n",
       "482121141                                这些 歌曲 都 是 经典作品 [ 亲亲 ]\n",
       "427963594                                偏偏 喜欢 你 ， 我 的 翩翩 夫人 。\n",
       "1382017788                以 爱情     以 时光 \\r\\r\\n \\r\\r\\n 纪贯 新 ~ ?\n",
       "46656982     我 和 他 来 一家 店 吃饭 ， 店里 在 放 这 首歌 ， 他 问 我 ， 你 知道 这...\n",
       "425557078                                           幸福 到 疼 … …\n",
       "有一个人曾让我知道                                                  NaN\n",
       "寄生于世原来是那么的好                                                NaN\n",
       "568096298                  超级 喜欢 的 一首歌 ， 偏偏 喜欢 你 【 大赞 】 [ 爱心 ]\n",
       "412381224                                      他 可能 会 单手 开 法拉利\n",
       "301593622                [ 多多 大笑 ] [ 多多 大笑 ] [ 多多 大笑 ] 笑 着 活下去\n",
       "1455906926                                           再见 吧 大渣 男\n",
       "1670031755                                [ 憨笑 ] 我 比 你 还俗   更穷\n",
       "301593622                        现在 一心 只想 搞钱 ， 我 比较 俗 ， 太穷 了 ！\n",
       "1730181168                                      哈哈哈哈 这个 年代 感 哦\n",
       "279684331                                     偏偏 喜欢 的 就是 得不到 ！\n",
       "621542625                                                阿 Lan\n",
       "...                                                        ...\n",
       "62338668                                                  nice\n",
       "62338668     愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...\n",
       "68320201     忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...\n",
       "246752393                                                  張國榮\n",
       "134205876    还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...\n",
       "122104993    班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...\n",
       "100442347    中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...\n",
       "118207115                                                别咒 王杰\n",
       "116595775    我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]\n",
       "60109810                                 2000 年生 却 偏偏 喜欢 80 年代\n",
       "63357164                              情爱   是 什么   只有 呵呵 [ 大哭 ]\n",
       "62338668                                                [ 可爱 ]\n",
       "95087236                                      对 啊 ， 为何 偏偏 喜欢 你\n",
       "68320201                                                [ 大笑 ]\n",
       "79282042                                  [ 皱眉 ] [ 皱眉 ] [ 皱眉 ]\n",
       "83512955                 听过 这 首歌 的 人 都 是 有 故事 的 男人 和 女人 [ 跳舞 ]\n",
       "67061365     上班 特别 累 的 时候 听到 香港 的 经典 感觉 整个 世界 都 属于 我 ， 要是 来...\n",
       "71401843                                当年 的 录像厅 前面 就 放 的 这 首歌\n",
       "103882075                                       他 还 没 死 [ 大哭 ]\n",
       "62338668                                                我 01 的\n",
       "62338668                                                  nice\n",
       "62338668     愛上 你 永遠 沒有 結果   很 好   我現 在 要 放棄 了   努力 忘記 你   ...\n",
       "68320201     忽然 想起 和 一个 朋友 的 对话 ， 她 因为 家庭 原因 极度 缺乏 安全感 。 \\r...\n",
       "246752393                                                  張國榮\n",
       "134205876    还 记得 那时 地方 电视台 点播 的 一些 曲子 吗 ？ 重点 中间 无广告 ， 那才 是...\n",
       "122104993    班固 ? 《 西都 赋 》 “ 愿宾 摅 怀旧 之 蓄念 ， 发 思古 之 幽情 。 ”  ...\n",
       "100442347    中午 广播 无意 听到 这 首歌 ， 然后 特意 关注 了 聊大 广播台 微博 找到 歌单 ...\n",
       "118207115                                                别咒 王杰\n",
       "116595775    我爸 只会 唱 一首歌 ， 就 这 首歌 把 我 妈 娶 到手 了 。 [ 憨笑 ] [ 憨笑 ]\n",
       "60109810                                 2000 年生 却 偏偏 喜欢 80 年代\n",
       "\n",
       "[20523 rows x 1 columns]>"
      ]
     },
     "execution_count": 74,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "k.head"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 33,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "array([ 0.        ,  0.        ,  0.        ,  0.23313783,  0.25648525,\n",
       "        0.27067134,  0.27910084,  0.70710683,  1.        ], dtype=float32)"
      ]
     },
     "execution_count": 33,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "sims[1]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 41,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "[array([ 0.81649655,  0.31412902,  0.        ,  0.34777319,  0.        ,\n",
      "        0.        ,  0.        ,  0.        ,  0.        ], dtype=float32), array([ 0.        ,  0.        ,  0.        ,  0.23313783,  0.25648525,\n",
      "        0.27067134,  0.27910084,  0.70710683,  1.        ], dtype=float32)]\n"
     ]
    }
   ],
   "source": [
    "similarity = list(sims)\n",
    "sim_file = open(\"sims.csv\",'w')\n",
    "for i in similarity:\n",
    "    sim_file.write(str(i)+'\\n')\n",
    "sim_file.close()\n",
    "print(similarity)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 43,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "similarity=pd.DataFrame(similarity)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 44,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "          0         1    2         3         4         5         6         7  \\\n",
      "0  0.816497  0.314129  0.0  0.347773  0.000000  0.000000  0.000000  0.000000   \n",
      "1  0.000000  0.000000  0.0  0.233138  0.256485  0.270671  0.279101  0.707107   \n",
      "\n",
      "     8  \n",
      "0  0.0  \n",
      "1  1.0  \n"
     ]
    }
   ],
   "source": [
    "print(similarity)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 45,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0    0.816497\n",
       "1    0.314129\n",
       "2    0.000000\n",
       "3    0.347773\n",
       "4    0.000000\n",
       "5    0.000000\n",
       "6    0.000000\n",
       "7    0.000000\n",
       "8    0.000000\n",
       "Name: 0, dtype: float64"
      ]
     },
     "execution_count": 45,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "similarity.iloc[0,:]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 46,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0    2\n",
       "1    4\n",
       "2    5\n",
       "3    6\n",
       "4    7\n",
       "5    8\n",
       "6    1\n",
       "7    3\n",
       "8    0\n",
       "Name: 0, dtype: int64"
      ]
     },
     "execution_count": 46,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "np.argsort(similarity.iloc[0,:])#升序"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 47,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0    0\n",
       "1    3\n",
       "2    1\n",
       "3    2\n",
       "4    4\n",
       "5    5\n",
       "6    6\n",
       "7    7\n",
       "8    8\n",
       "Name: 0, dtype: int64"
      ]
     },
     "execution_count": 47,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "np.argsort(-similarity.iloc[0,:])#降序"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 42,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import pandas as pd"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.2"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
